Professional-Data-Engineer 試験問題 36
画像認識分野のニッチな製品に取り組んでいます。チームは、独自に実装したカスタムC++ TensorFlow演算を主体としたモデルを開発しました。これらの演算はメインのトレーニングループ内で使用され、大規模な行列乗算を実行しています。現在、モデルのトレーニングには最大で数日かかります。Google Cloudのアクセラレータを使用することで、この時間を大幅に短縮し、コストを抑えたいと考えています。どうすればよいでしょうか?
Professional-Data-Engineer 試験問題 37
Google Cloud で構造化データのバッチ パイプラインを再構築したい PySpark を使用して大規模なデータ変換を行っていますが、パイプラインの実行に 12 時間以上かかります 開発とパイプラインの実行時間を短縮するために、サーバーレス ツールと SQL 構文を使用したい 元データをすでに Cloud Storage に移動してある 速度と処理の要件を満たしながら、Google Cloud でパイプラインを構築するにはどうすればよいでしょうか。
Professional-Data-Engineer 試験問題 38
あなたは自動車メーカーに勤務しており、Google Cloud Pub/Sub を使用して異常なセンサーイベントをキャプチャするためのデータパイプラインを構築しました。Cloud Pub/Sub の push サブスクリプションを使用して、これらの異常なイベントが発生した際にアクションを実行するために作成したカスタム HTTPS エンドポイントを呼び出しています。このカスタム HTTPS エンドポイントは、大量の重複メッセージを受信し続けています。これらの重複メッセージの原因として最も考えられるものは何でしょうか?
Professional-Data-Engineer 試験問題 39
組織では6か月間、Google BigQueryでデータを収集・分析してきました。分析対象データの大部分は、events_partitionedという時間分割テーブルに格納されています。クエリコストを削減するため、過去14日間のデータのみをクエリするeventsというビューを作成しました。このビューはレガシーSQLで記述されています。来月、既存のアプリケーションがBigQueryに接続し、ODBC接続を介してイベントデータを読み取る予定です。これらのアプリケーションが接続できることを確認する必要があります。必要なアクションは2つありますか?(2つ選択してください。)
Professional-Data-Engineer 試験問題 40
Bigtable の時系列データにおけるホットスポットを回避するために推奨される方法はどれですか?
