Professional-Data-Engineer 試験問題 116
キャンセルしたい仕事があります。これはストリーミングパイプラインであり、処理中のデータが処理されて出力に書き込まれるようにする必要があります。パイプラインジョブを停止するためにDataflow監視コンソールで使用できるコマンドは次のうちどれですか?
Professional-Data-Engineer 試験問題 117
その列に可能なすべての値がわからない場合、どのTensorFlow関数を使用してカテゴリ列を構成できますか?
Professional-Data-Engineer 試験問題 118
あなたの会社は、GoogleCloudDataflowで学習アルゴリズムのデータ前処理を実行しています。
このステップでは多数のデータログが生成されており、チームはそれらを分析したいと考えています。キャンペーンの動的な性質により、データは1時間ごとに指数関数的に増加しています。
データサイエンティストは、ログの新しい主要機能のデータを読み取るために、次のコードを作成しました。
BigQueryIO.Read
.named( "ReadLogData")
.from( "clouddataflow-readonly:samples.log_data")
このデータ読み取りのパフォーマンスを向上させたいと考えています。あなたは何をするべきか?
このステップでは多数のデータログが生成されており、チームはそれらを分析したいと考えています。キャンペーンの動的な性質により、データは1時間ごとに指数関数的に増加しています。
データサイエンティストは、ログの新しい主要機能のデータを読み取るために、次のコードを作成しました。
BigQueryIO.Read
.named( "ReadLogData")
.from( "clouddataflow-readonly:samples.log_data")
このデータ読み取りのパフォーマンスを向上させたいと考えています。あなたは何をするべきか?
Professional-Data-Engineer 試験問題 119
データウェアハウスとしてGoogleBigQueryを使用しています。ユーザーは、クエリをいつ実行しても、次の単純なクエリの実行が非常に遅いと報告しています。
SELECT国、州、都市FROM [myproject:mydataset.mytable] GROUP BY国クエリのクエリプランを確認すると、ステージ1の[読み取り]セクションに次の出力が表示されます。

このクエリの遅延の最も可能性の高い原因は何ですか?
SELECT国、州、都市FROM [myproject:mydataset.mytable] GROUP BY国クエリのクエリプランを確認すると、ステージ1の[読み取り]セクションに次の出力が表示されます。

このクエリの遅延の最も可能性の高い原因は何ですか?
Professional-Data-Engineer 試験問題 120
次のうち、プリミティブロールを使用して不可能なものはどれですか?
