Professional-Data-Engineer 試験問題 161

特定のテーブルから BigQuery データを 1 日に複数回確認する必要があります。クエリを実行する基になるテーブルのサイズは数ペタバイトですが、データをフィルタリングして、下流のユーザーにシンプルな集計を提供したいと考えています。クエリをより高速に実行し、最新の分析情報をより早く取得したいと考えています。どうすればよいでしょうか。
  • Professional-Data-Engineer 試験問題 162

    Google の Dataflow SDK を使用して、以下に示すような顧客データを分析する予定です。プロジェクトの要件は、データ ソースから顧客名のみを抽出し、出力 PCollection に書き込むことです。
    トム、555 X 通り
    ティム、553 Yストリート
    サム、111 Z ストリート
    上記のデータ処理要件に最適な操作はどれですか?
  • Professional-Data-Engineer 試験問題 163

    世界中に分散されたオークション アプリケーションでは、ユーザーがアイテムに入札できます。時々、ユーザーがほぼ同時に同じ入札を行い、異なるアプリケーション サーバーがそれらの入札を処理することがあります。各入札イベントには、アイテム、金額、ユーザー、およびタイムスタンプが含まれます。これらの入札イベントをリアルタイムで 1 つの場所に集めて、どのユーザーが最初に入札したかを判断したいとします。どうすればよいでしょうか。
  • Professional-Data-Engineer 試験問題 164

    社内の IT アプリケーションの 1 つと Google BigQuery を統合して、ユーザーがアプリケーションのインターフェースから BigQuery にクエリを実行できるようにしたいと考えています。個々のユーザーに BigQuery への認証を行わせたくないし、データセットへのアクセス権も与えたくありません。IT アプリケーションから BigQuery に安全にアクセスする必要があります。どうすればよいでしょうか。
  • Professional-Data-Engineer 試験問題 165

    パーティション化されたテーブルにデータを格納する方法としてサポートされていないのはどれですか?