Professional-Data-Engineer 試験問題 196
YARN ResourceManager と HDFS NameNode インターフェースは Cloud Dataproc クラスタで利用できます。
____。
____。
Professional-Data-Engineer 試験問題 197
顧客が電子商取引サイトで購入する可能性を予測する新しいディープ チーミング モデルを開発しています。元のトレーニング データと新しいテスト データの両方に対してモデルの評価を実行した後、モデルがデータに過剰適合していることがわかりました。新しいデータを予測する際のモデルの精度を改善したいと考えています。どうすればよいですか?
Professional-Data-Engineer 試験問題 198
リアルタイム アプリケーションに Bigtable を使用しており、読み取りと書き込みが混在する大きな負荷があります。最近、追加のユース ケースを特定し、データベース全体の特定の統計を計算する分析ジョブを 1 時間ごとに実行する必要があります。運用アプリケーションの信頼性と分析ワークロードの両方を確保する必要があります。
何をすべきでしょうか?
何をすべきでしょうか?
Professional-Data-Engineer 試験問題 199
時系列トランザクション データをコピーするデータ パイプラインを作成し、データ サイエンス チームが BigQuery 内からクエリを実行して分析できるようにする必要があります。1 時間ごとに、数千のトランザクションが新しいステータスで更新されます。初期データセットのサイズは 1.5 PB で、1 日あたり 3 TB ずつ増加します。データは高度に構造化されており、データ サイエンス チームはこのデータに基づいて機械学習モデルを構築します。データ サイエンス チームのパフォーマンスと使いやすさを最大化したいと考えています。採用すべき 2 つの戦略はどれですか (2 つ選択してください)。
Professional-Data-Engineer 試験問題 200
データフィードを受信する消費者と金融市場データを共有するアプリケーションを構築しています。
データは市場からリアルタイムで収集されます。消費者は次の方法でデータを受け取ります。
* リアルタイムイベントストリーム
* リアルタイムストリームと履歴データへのANSI SQLアクセス
* 履歴エクスポートの一括処理
どのソリューションを使用すべきでしょうか?
データは市場からリアルタイムで収集されます。消費者は次の方法でデータを受け取ります。
* リアルタイムイベントストリーム
* リアルタイムストリームと履歴データへのANSI SQLアクセス
* 履歴エクスポートの一括処理
どのソリューションを使用すべきでしょうか?
