Professional-Data-Engineer 試験問題 11

あなたは世界的な運送会社で働いています。40 TB のデータでモデルをトレーニングして、各地域のどの船舶が特定の日に配達遅延を引き起こす可能性があるかを予測したいと考えています。モデルは、複数のソースから収集された複数の属性に基づいています。GeoJSON 形式の位置情報を含むテレメトリ データは各船から取得され、1 時間ごとにロードされます。地域内で遅延を引き起こす可能性がある船舶の数と船舶を示すダッシュボードが必要です。予測と地理空間処理のためのネイティブ機能を備えたストレージ ソリューションを使用したいと考えています。どのストレージ ソリューションを使用する必要がありますか?
  • Professional-Data-Engineer 試験問題 12

    あなたは、オペレーティング システムのトランザクション データをオンプレミス データベースから GCP に移行する必要がある中規模企業で働いています。データベースのサイズは約 20 TB です。どのデータベースを選択すればよいでしょうか?
  • Professional-Data-Engineer 試験問題 13

    あなたの会社は現在、キャンペーン用のデータ パイプラインをセットアップしています。すべての Google Cloud Pub/Sub 向け
    ストリーミング データの重要なビジネス要件の 1 つは、キャンペーン中に入力とそのタイミングを定期的に識別できることです。エンジニアは、この目的のために Google Cloud Dataflow でウィンドウ処理と変換を使用することを決定しました。ただし、この機能をテストすると、Cloud Dataflow ジョブがすべてのストリーミング挿入で失敗することがわかりました。この問題の最も考えられる原因は何ですか?
  • Professional-Data-Engineer 試験問題 14

    あなたの会社は、Google Cloud Dataflow で学習アルゴリズムのデータ前処理を実行しています。
    このステップ中に多数のデータ ログが生成されており、チームはそれらを分析したいと考えています。
    キャンペーンの動的な性質により、データは時間ごとに指数関数的に増加しています。
    データ サイエンティストは、ログ内の新しい重要な機能のデータを読み取るために次のコードを作成しました。
    BigQueryIO.Read
    .named("ReadLogData")
    .from("clouddataflow-readonly:samples.log_data")
    このデータ読み取りのパフォーマンスを向上させたいと考えています。あなたは何をするべきか?
  • Professional-Data-Engineer 試験問題 15

    Bigtable クラスタ内の特定のノードで不釣り合いな数の読み取りおよび/または書き込みを引き起こす可能性がある行キーはどれですか (回答を 2 つ選択してください)。