Professional-Data-Engineer 試験問題 146

会社のオンプレミスのApacheHadoopサーバーはサポート終了に近づいており、IT部門はクラスターをGoogleCloudDataprocに移行することを決定しました。クラスタの同様の移行には、ノードごとに50TBのGoogle永続ディスクが必要になります。CIOは、それだけのブロックストレージを使用するコストを懸念しています。移行のストレージコストを最小限に抑える必要があります。あなたは何をするべきか?
  • Professional-Data-Engineer 試験問題 147

    ソーシャルメディアの投稿をGoogleBigQueryに保存し、ほぼリアルタイムで1分あたり10,000メッセージの割合で分析する必要があります。最初に、個々の投稿にストリーミング挿入を使用するようにアプリケーションを設計します。アプリケーションは、ストリーミング挿入の直後にデータ集約も実行します。ストリーミング挿入後のクエリは強い一貫性を示さず、クエリからのレポートは処理中のデータを見逃す可能性があることがわかりました。アプリケーションの設計をどのように調整できますか?
  • Professional-Data-Engineer 試験問題 148

    あなたはeコマース会社のバスケット放棄システムを設計しています。システムは、次のルールに基づいてユーザーにメッセージを送信します。
    *サイトでのユーザーによる1時間の対話はありません
    *バスケットに30ドル以上の製品を追加しました
    *トランザクションを完了していません
    Google Cloud Dataflowを使用してデータを処理し、メッセージを送信するかどうかを決定します。パイプラインをどのように設計する必要がありますか?
  • Professional-Data-Engineer 試験問題 149

    あなたの会社の事業主はあなたに銀行取引のデータベースを与えました。各行には、ユーザーID、トランザクションタイプ、トランザクションの場所、およびトランザクション量が含まれます。データに適用できる機械学習の種類を調査するように求められます。使用できる機械学習アプリケーションは3つありますか?(3つ選択してください。)
  • Professional-Data-Engineer 試験問題 150

    ユーザーのブログ投稿の件名ラベルを自動的に生成するアプリケーションをGoogleCloudで開発しています。この機能をすばやく追加するという競争圧力にさらされており、追加の開発者リソースはありません。チームの誰も機械学習の経験がありません。あなたは何をするべきか?