Professional-Data-Engineer 試験問題 111
Cloud Dataprocクラスターのスケーリングには、通常、____が含まれます。
Professional-Data-Engineer 試験問題 112
CloudDataprocクラスターを管理しています。クラスターで進行中の作業を失うことなく、コストを最小限に抑えながら、ジョブをより高速に実行する必要があります。あなたは何をするべきか?
Professional-Data-Engineer 試験問題 113
あなたは、企業が経済動向を特定するのを支援する経済コンサルティング会社で働いています。
分析の一環として、Google BigQueryを使用して、顧客データを、パン、ガソリン、ミルクなど、販売された最も一般的な100の商品の平均価格と関連付けます。これらの商品の平均価格は30分ごとに更新されます。このデータを最新の状態に保ち、BigQueryの他のデータと可能な限り安価に組み合わせることができるようにする必要があります。あなたは何をするべきか?
分析の一環として、Google BigQueryを使用して、顧客データを、パン、ガソリン、ミルクなど、販売された最も一般的な100の商品の平均価格と関連付けます。これらの商品の平均価格は30分ごとに更新されます。このデータを最新の状態に保ち、BigQueryの他のデータと可能な限り安価に組み合わせることができるようにする必要があります。あなたは何をするべきか?
Professional-Data-Engineer 試験問題 114
ETLジョブを移行してBigQueryで実行した後、移行されたジョブの出力が元のジョブの出力と同じであることを確認する必要があります。元のジョブの出力を含むテーブルをロードし、その内容を移行されたジョブからの出力と比較して、それらが同一であることを示したいと考えています。テーブルには、比較のためにテーブルを結合できる主キー列が含まれていません。
あなたは何をするべきか?
あなたは何をするべきか?
Professional-Data-Engineer 試験問題 115
Cloud Pub / Subトピックからメッセージを受信し、その結果をEUのBigQueryデータセットに書き込むCloudDataflowでパイプラインを実行しています。現在、パイプラインはeurope-west4にあり、最大3つのワーカー、インスタンスタイプn1-standard-1があります。ピーク時には、3つのワーカーすべてが最大CPU使用率になっているときに、パイプラインがタイムリーにレコードを処理するのに苦労していることに気付きます。パイプラインのパフォーマンスを向上させるために実行できる2つのアクションはどれですか?(2つ選択してください。)
