Professional-Data-Engineer 試験問題 126

あなたの会社は独自のシステムを使用して、6時間ごとに在庫データをクラウドのデータ取り込みサービスに送信しています。送信されるデータには、いくつかのフィールドのペイロードと送信のタイムスタンプが含まれます。送信に懸念がある場合、システムはデータを再送信します。データを最も効率的に重複排除するにはどうすればよいですか?
  • Professional-Data-Engineer 試験問題 127

    ソフトウェアは、すべてのメッセージに単純なJSON形式を使用します。これらのメッセージはGoogleCloudPub / Subに公開され、Google Cloud Dataflowで処理されて、CFOのリアルタイムダッシュボードが作成されます。テスト中に、ダッシュボードに一部のメッセージが表示されないことに気付きました。ログを確認すると、すべてのメッセージがCloud Pub/Subに正常に公開されています。次に何をすべきですか?
  • Professional-Data-Engineer 試験問題 128

    これらのソースのうち、BigQueryにデータを読み込めないのはどれですか?
  • Professional-Data-Engineer 試験問題 129

    Cloud Dataproc Viewerはどのアクションを実行できますか?
  • Professional-Data-Engineer 試験問題 130

    数百万台のコンピューターの時系列CPUとメモリ使用量を保存するデータベースを選択する必要があります。このデータを1秒間隔のサンプルに保存する必要があります。アナリストは、データベースに対してリアルタイムのアドホック分析を実行します。実行されるすべてのクエリに対して課金されることを避け、スキーマ設計がデータセットの将来の拡張を可能にすることを確認する必要があります。どのデータベースとデータモデルを選択する必要がありますか?