Professional-Data-Engineer 試験問題 281

数百万台のコンピューターのCPUとメモリの使用状況を時系列で保存するためのデータベースを選択する必要があります。このデータは1秒間隔でサンプリングして保存する必要があります。アナリストは、このデータベースに対してリアルタイムのアドホック分析を実行することになります。クエリ実行ごとに課金されることを避け、スキーマ設計によってデータセットの将来的な拡張に対応できるようにする必要があります。どのデータベースとデータモデルを選択すべきでしょうか?
  • Professional-Data-Engineer 試験問題 282

    Dataproc クラスタにプリエンプティブワーカーを追加するときに適用されるルールはどれですか (選択してください)
    (2つの回答)?
  • Professional-Data-Engineer 試験問題 283

    HadoopジョブをオンプレミスクラスタからDataprocとGCSに移行しました。Sparkジョブは、多数のシャッフィング操作で構成される複雑な分析ワークロードであり、初期データはParquetファイル(平均
    それぞれ200~400MBのサイズです。Dataprocへの移行後、パフォーマンスに若干の低下が見られるため、最適化を検討しています。組織はコスト重視であることを考慮し、このワークロードでは引き続きプリエンプティブ(非プリエンプティブワーカー2台のみ)でDataprocを使用する予定です。
    何をすべきでしょうか?
  • Professional-Data-Engineer 試験問題 284

    インフラストラクチャ チームが、Google Cloud とオンプレミス ネットワーク間の相互接続リンクを設定しました。
    オンプレミスでホストされているApache Kafkaクラスタからストリーミングでデータを取り込むための、高スループットのストリーミングパイプラインを設計しています。そして、可能な限りレイテンシを最小限に抑えながら、BigQueryにデータを保存したいと考えています。
    何をすべきでしょうか?
  • Professional-Data-Engineer 試験問題 285

    Cloud Bigtable は、Google の ______ ビッグデータ データベース サービスです。