Professional-Data-Engineer 試験問題 196

YARN ResourceManager と HDFS NameNode インターフェースは Cloud Dataproc クラスタで利用できます。
____。
  • Professional-Data-Engineer 試験問題 197

    顧客が電子商取引サイトで購入する可能性を予測する新しいディープ チーミング モデルを開発しています。元のトレーニング データと新しいテスト データの両方に対してモデルの評価を実行した後、モデルがデータに過剰適合していることがわかりました。新しいデータを予測する際のモデルの精度を改善したいと考えています。どうすればよいですか?
  • Professional-Data-Engineer 試験問題 198

    リアルタイム アプリケーションに Bigtable を使用しており、読み取りと書き込みが混在する大きな負荷があります。最近、追加のユース ケースを特定し、データベース全体の特定の統計を計算する分析ジョブを 1 時間ごとに実行する必要があります。運用アプリケーションの信頼性と分析ワークロードの両方を確保する必要があります。
    何をすべきでしょうか?
  • Professional-Data-Engineer 試験問題 199

    時系列トランザクション データをコピーするデータ パイプラインを作成し、データ サイエンス チームが BigQuery 内からクエリを実行して分析できるようにする必要があります。1 時間ごとに、数千のトランザクションが新しいステータスで更新されます。初期データセットのサイズは 1.5 PB で、1 日あたり 3 TB ずつ増加します。データは高度に構造化されており、データ サイエンス チームはこのデータに基づいて機械学習モデルを構築します。データ サイエンス チームのパフォーマンスと使いやすさを最大化したいと考えています。採用すべき 2 つの戦略はどれですか (2 つ選択してください)。
  • Professional-Data-Engineer 試験問題 200

    データフィードを受信する消費者と金融市場データを共有するアプリケーションを構築しています。
    データは市場からリアルタイムで収集されます。消費者は次の方法でデータを受け取ります。
    * リアルタイムイベントストリーム
    * リアルタイムストリームと履歴データへのANSI SQLアクセス
    * 履歴エクスポートの一括処理
    どのソリューションを使用すべきでしょうか?