Professional-Data-Engineer 試験問題 191
物流会社を経営しており、車両搭載センサーのイベント配信の信頼性向上を目指しています。これらのイベントを収集するために、世界各地に小規模なデータセンターを運用していますが、イベント収集インフラからイベント処理インフラへの接続を提供する専用回線は信頼性が低く、遅延も予測できません。この問題を最も費用対効果の高い方法で解決したいと考えています。どうすればよいでしょうか?
Professional-Data-Engineer 試験問題 192
あなたは広告会社に勤務しており、広告ブロックのクリックスルー率を予測する Spark ML モデルを開発しました。これまではすべてオンプレミスのデータセンターで開発していましたが、現在、Google Cloud への移行を進めています。データセンターは BigQuery に移行されます。Spark ML モデルを定期的に再トレーニングしているため、既存のトレーニング パイプラインを Google Cloud に移行する必要があります。どうすればよいでしょうか?
Professional-Data-Engineer 試験問題 193
地震データを分析するシステムを設計します
a. 抽出、変換、ロード(ETL)プロセスは、Apache Hadoop クラスター上で一連の MapReduce ジョブとして実行されています。ETL プロセスでは、一部のステップの計算コストが高いため、データセットの処理に数日かかります。その後、センサーのキャリブレーションステップが省略されていることが判明しました。今後、センサーのキャリブレーションを体系的に実行するために、ETL プロセスをどのように変更すればよいでしょうか。
a. 抽出、変換、ロード(ETL)プロセスは、Apache Hadoop クラスター上で一連の MapReduce ジョブとして実行されています。ETL プロセスでは、一部のステップの計算コストが高いため、データセットの処理に数日かかります。その後、センサーのキャリブレーションステップが省略されていることが判明しました。今後、センサーのキャリブレーションを体系的に実行するために、ETL プロセスをどのように変更すればよいでしょうか。
Professional-Data-Engineer 試験問題 194
顧客のeコマースサイトでの購入可能性を予測する新しいディープチーミングモデルを開発しています。元のトレーニングデータと新しいテストデータの両方でモデルの評価を実行したところ、モデルがデータに過剰適合していることがわかりました。新しいデータに対する予測精度を向上させたいと考えています。どうすればよいでしょうか?
Professional-Data-Engineer 試験問題 195
Cloud Dataproc は、マネージド Apache Hadoop および Apache _____ サービスです。
