Professional-Data-Engineer 試験問題 76

約 3 年前に新しいゲーム アプリをリリースしました。前日のログ ファイルを、テーブル名形式が LOGS_yyyymmdd である別の Google BigQuery テーブルにアップロードしています。テーブル ワイルドカード関数を使用して、すべての時間範囲の日次レポートと月次レポートを生成しています。
最近、長い日付範囲をカバーする一部のクエリが 1,000 テーブルの制限を超えて失敗していることを発見しました。この問題をどのように解決できますか?
  • Professional-Data-Engineer 試験問題 77

    ウェブサーバーは、クリック イベントをメッセージとして Pub/Sub トピックに送信します。ウェブサーバーは、クリックが発生した時刻を示すイベント タイムスタンプ属性をメッセージに含めます。サブスクリプションを通じてこの Pub/Sub トピックから読み取り、いくつかの変換を適用し、その結果を広告部門が使用するために別の Pub/Sub トピックに書き込む Dataflow ストリーミング ジョブがあります。広告部門は、対応するクリックの発生から 30 秒以内に各メッセージを受信する必要がありますが、メッセージの受信が遅れていると報告されています。Dataflow ジョブのシステム ラグは約 5 秒で、データの鮮度は約 40 秒です。いくつかのメッセージを調べると、イベント タイムスタンプと公開時刻の間に 1 秒以内のラグがあることがわかります。問題は何ですか。どうすればよいですか。
  • Professional-Data-Engineer 試験問題 78

    Google Cloud Bigtable インスタンスの SSD ストレージと HDD ストレージを切り替えるために推奨されるアクションは何ですか?
  • Professional-Data-Engineer 試験問題 79

    Your company maintains a hybrid deployment with GCP, where analytics are performed on your
    anonymized customer data. The data are imported to Cloud Storage from your data center through parallel
    uploads to a data transfer server running on GCP. Management informs you that the daily transfers take
    too long and have asked you to fix the problem. You want to maximize transfer speeds. Which action
    should you take?
  • Professional-Data-Engineer 試験問題 80

    スケジュールに従って実行する必要があるバッチ ジョブをいくつか実装しています。これらのジョブには、特定の順序で実行する必要がある相互依存のステップが多数あります。ジョブの一部には、シェル スクリプトの実行、Hadoop ジョブの実行、BigQuery でのクエリの実行が含まれます。ジョブは、数分から数時間実行されることが予想されます。ステップが失敗した場合は、一定回数再試行する必要があります。これらのジョブの実行を管理するには、どのサービスを使用する必要がありますか。