Professional-Data-Engineer 試験問題 106

あなたの会社は、GoogleCloudDataflowで学習アルゴリズムのデータ前処理を実行しています。
このステップでは多数のデータログが生成されており、チームはそれらを分析したいと考えています。
キャンペーンの動的な性質により、データは1時間ごとに指数関数的に増加しています。
データサイエンティストは、ログの新しい主要機能のデータを読み取るために、次のコードを作成しました。
BigQueryIO.Read
.named( "ReadLogData")
.from( "clouddataflow-readonly:samples.log_data")
このデータ読み取りのパフォーマンスを向上させたいと考えています。あなたは何をするべきか?
  • Professional-Data-Engineer 試験問題 107

    組織は、ユーザーレベルのデータを含むテーブルを含むGoogleBigQueryデータセットを維持しています。ユーザーレベルのデータへのアクセスを制御しながら、このデータの集計を他のGoogleCloudプロジェクトに公開したいと考えています。さらに、全体的なストレージコストを最小限に抑え、他のプロジェクトの分析コストがそれらのプロジェクトに割り当てられるようにする必要があります。彼らは何をすべきですか?
  • Professional-Data-Engineer 試験問題 108

    あなたの会社は、GoogleCloudDataflowで学習アルゴリズムのデータ前処理を実行しています。
    このステップでは多数のデータログが生成されており、チームはそれらを分析したいと考えています。キャンペーンの動的な性質により、データは1時間ごとに指数関数的に増加しています。
    データサイエンティストは、ログの新しい主要機能のデータを読み取るために、次のコードを作成しました。
    BigQueryIO.Read
    .named( "ReadLogData")
    .from( "clouddataflow-readonly:samples.log_data")
    このデータ読み取りのパフォーマンスを向上させたいと考えています。あなたは何をするべきか?
  • Professional-Data-Engineer 試験問題 109

    人間の顔が含まれているかどうかについてそれぞれラベルが付けられた画像のデータセットがあるとします。このラベル付けされたデータセットを使用して画像内の人間の顔を認識するニューラルネットワークを作成するには、どのアプローチが最も効果的である可能性がありますか?
  • Professional-Data-Engineer 試験問題 110

    これらのうち、スパースベクトルの値の例はどれですか?(2つの答えを選択してください。)