Professional-Data-Engineer 試験問題 201

Cloud Bigtable のパフォーマンスが低い正当な理由ではないものはどれですか?
  • Professional-Data-Engineer 試験問題 202

    Google Dataflow SDK を使用して、以下に示すような顧客データを分析する予定です。プロジェクトの要件は、データソースから顧客名のみを抽出し、出力 PCollection に書き込むことです。
    トム、555 X通り
    ティム、553 Yストリート
    サム、Z通り111番地
    上記のデータ処理要件に最適な操作はどれですか?
  • Professional-Data-Engineer 試験問題 203

    「person」という列の中に「city」というネストされた列を含むテーブルがあり、BigQuery で次のクエリを送信しようとするとエラーが発生するとします。
    `project1.example.table1` から person を選択 WHERE city = "London"
    どのようにエラーを修正しますか?
  • Professional-Data-Engineer 試験問題 204

    1,000個のセンサーからなるネットワークがあります。センサーは時系列データ(センサーごとに1秒あたり1つのメトリックとタイムスタンプ)を生成します。既に1TBのデータがあり、毎日1GBずつ増加すると予想しています。このデータには2つの方法でアクセスする必要があります。1つ目のアクセスパターンでは、特定のタイムスタンプで保存された特定のセンサーからメトリックを取得し、平均1桁ミリ秒のレイテンシで実行する必要があります。2つ目のアクセスパターンでは、結合を含む複雑な分析クエリを1日に1回データに対して実行する必要があります。このデータはどのように保存すればよいでしょうか?
  • Professional-Data-Engineer 試験問題 205

    Google Cloud 上で、ユーザーのブログ投稿の件名ラベルを自動生成するアプリケーションを開発しています。この機能を迅速に追加しなければならないという競争上のプレッシャーがあり、追加の開発リソースもありません。チーム内に機械学習の経験者はいません。どうすればよいでしょうか?