Professional-Data-Engineer 試験問題 36
あなたは、複数の事業部門を抱える大企業のBI責任者です。各部門はそれぞれ異なる優先順位と予算を持っています。BigQueryのオンデマンド料金プランを利用しており、プロジェクトごとに2,000の同時オンデマンドスロットを割り当てています。組織内のユーザーがクエリを実行するためのスロットを確保できないことが時々あるため、これを修正する必要があります。アカウントに新しいプロジェクトを追加したくないと考えています。
何をすべきでしょうか?
何をすべきでしょうか?
Professional-Data-Engineer 試験問題 37
BigQueryにあるあなたの会社のcustomer_orderテーブルには、1,000万人の顧客の注文履歴が保存されており、テーブルサイズは10PBです。サポートチームが注文履歴を閲覧するためのダッシュボードを作成する必要があります。ダッシュボードには、countrynameとusernameという2つのフィルターがあります。どちらもBigQueryテーブルの文字列データ型です。フィルターを適用すると、ダッシュボードはテーブルから注文履歴を取得し、クエリ結果を表示します。しかし、次のクエリにフィルターを適用すると、ダッシュボードに結果が表示されるまでに時間がかかります。

より高速なアクセスをサポートするには、BigQuery テーブルをどのように再設計すればよいでしょうか?

より高速なアクセスをサポートするには、BigQuery テーブルをどのように再設計すればよいでしょうか?
Professional-Data-Engineer 試験問題 38
BigQueryには過去3年間の履歴データがあり、データパイプラインによって毎日新しいデータがBigQueryに配信されています。データサイエンスチームが日付列でフィルタリングされ、3090日分のデータに制限されたクエリを実行すると、テーブル全体がスキャンされることに気づきました。また、請求額が予想よりも急速に増加していることにも気づきました。SQLクエリの実行能力を維持しながら、できるだけ費用対効果の高い方法でこの問題を解決したいと考えています。どうすればよいでしょうか?
Professional-Data-Engineer 試験問題 39
あなたの会社では、毎時2万件のファイルが生成されます。各データファイルは4KB未満のカンマ区切り値(CSV)ファイルとしてフォーマットされています。すべてのファイルは、処理前にGoogle Cloud Platformに取り込まれる必要があります。会社のサイトからGoogle Cloudへのレイテンシは200ミリ秒で、インターネット接続の帯域幅は50Mbpsに制限されています。現在、データの取り込みポイントとして、Google Compute Engineの仮想マシン上にセキュアFTP(SFTP)サーバーをデプロイしています。ローカルSFTPクライアントは専用マシン上で実行され、CSVファイルをそのまま送信します。目標は、前日のデータを含むレポートを、経営陣が24時間以内に利用できるようにすることです。
毎日午前10時。この設計では、帯域幅の使用率はかなり低いものの、現状のトラフィック量にほとんど対応できていません。
季節性により、今後3ヶ月間でファイル数が倍増すると予想されています。どのような対策を講じるべきですか?(2つ選択してください。)
毎日午前10時。この設計では、帯域幅の使用率はかなり低いものの、現状のトラフィック量にほとんど対応できていません。
季節性により、今後3ヶ月間でファイル数が倍増すると予想されています。どのような対策を講じるべきですか?(2つ選択してください。)
Professional-Data-Engineer 試験問題 40
Cloud Composer を使用して ETL パイプラインをオーケストレートしています。Apache Airflow の有向非巡回グラフ(DAG)内のタスクの 1 つがサードパーティのサービスに依存しています。タスクが成功しなかった場合に通知を受け取りたいのですが、どうすればよいでしょうか?

