Professional-Data-Engineer 試験問題 181
データ ウェアハウスとして Google BigQuery を使用しています。ユーザーは、クエリを実行するタイミングに関係なく、次の単純なクエリの実行が非常に遅いと報告しています。
[myproject:mydataset.mytable] から国、州、都市を選択し、国ごとにグループ化します。
クエリのクエリ プランを確認すると、Stage:1 の Read セクションに次の出力が表示されます。

このクエリの遅延の最も考えられる原因は何ですか?
[myproject:mydataset.mytable] から国、州、都市を選択し、国ごとにグループ化します。
クエリのクエリ プランを確認すると、Stage:1 の Read セクションに次の出力が表示されます。

このクエリの遅延の最も考えられる原因は何ですか?
Professional-Data-Engineer 試験問題 182
金融サービス会社はクラウド テクノロジーに移行しており、50 TB の財務時系列データをクラウドに保存したいと考えています。このデータは頻繁に更新され、新しいデータが常にストリーミングされます。
あなたの会社は、既存の Apache Hadoop ジョブをクラウドに移行して、このデータについての洞察を得たいと考えています。データの保存にはどの製品を使用する必要がありますか?
あなたの会社は、既存の Apache Hadoop ジョブをクラウドに移行して、このデータについての洞察を得たいと考えています。データの保存にはどの製品を使用する必要がありますか?
Professional-Data-Engineer 試験問題 183
タイムスタンプ列と ID 列の WHERE 句を使用して BigQuery テーブルをフィルタリングするクエリがあります。bq query -dry_run を使用すると、タイムスタンプと ID のフィルターがデータ全体のごく一部を選択しているにもかかわらず、クエリによってテーブルのフル スキャンがトリガーされることがわかります。既存の SQL クエリへの変更を最小限に抑え、BigQuery によってスキャンされるデータの量を削減したいと考えています。あなたは何をするべきか?
Professional-Data-Engineer 試験問題 184
Dataflow SDK は最近どの Apache サービスに移行されましたか?
Professional-Data-Engineer 試験問題 185
あなたは広告会社で働いており、広告ブロックでのクリックスルー率を予測するための Spark ML モデルを開発しました。あなたはオンプレミス データセンターですべてを開発してきましたが、現在、Google Cloud への移行を進めています。データセンターが間もなく閉鎖されるため、迅速なリフトアンドシフト移行が必要です。ただし、使用していたデータは BigQuery に移行されます。
Spark ML モデルは定期的に再トレーニングするため、既存のトレーニング パイプラインを Google Cloud に移行する必要があります。あなたは何をするべきか?
Spark ML モデルは定期的に再トレーニングするため、既存のトレーニング パイプラインを Google Cloud に移行する必要があります。あなたは何をするべきか?
