Professional-Data-Engineer 試験問題 186
あなたは、Cloud Pub/Sub から Cloud Dataflow を介して BigQuery に IoT データをストリーミングするための新しいパイプラインを Google Cloud に作成しています。データをプレビューすると、データの約 2% が破損しているように見えます。この破損したデータを除外するには、Cloud Dataflow パイプラインを変更する必要があります。あなたは何をするべきか?
Professional-Data-Engineer 試験問題 187
あなたの会社は、Google Cloud Dataflow で学習アルゴリズムのデータ前処理を実行しています。このステップ中に多数のデータ ログが生成されており、チームはそれらを分析したいと考えています。キャンペーンの動的な性質により、データは時間ごとに指数関数的に増加しています。
データ サイエンティストは、ログ内の新しい重要な機能のデータを読み取るために次のコードを作成しました。
BigQueryIO.Read
.named("ReadLogData")
.from("clouddataflow-readonly:samples.log_data")
このデータ読み取りのパフォーマンスを向上させたいと考えています。あなたは何をするべきか?
データ サイエンティストは、ログ内の新しい重要な機能のデータを読み取るために次のコードを作成しました。
BigQueryIO.Read
.named("ReadLogData")
.from("clouddataflow-readonly:samples.log_data")
このデータ読み取りのパフォーマンスを向上させたいと考えています。あなたは何をするべきか?
Professional-Data-Engineer 試験問題 188
あなたは、ユーザーのブログ投稿の件名ラベルを自動的に生成するアプリケーションを Google Cloud 上で開発しています。この機能をすぐに追加するという競争上のプレッシャーにさらされていますが、追加の開発者リソースはありません。あなたのチームには機械学習の経験のある人がいません。あなたは何をするべきか?
Professional-Data-Engineer 試験問題 189
Cloud Dataproc でサポートされているジョブ タイプは次のうちどれですか (回答を 3 つ選択してください)。
Professional-Data-Engineer 試験問題 190
Dataflow パイプラインに関して正しくないのは次のうちどれですか?
