Professional-Data-Engineer 試験問題 31

組織は、ユーザーレベルのデータを含むテーブルを含む Google BigQuery データセットを管理しています。彼らは、ユーザーレベルのデータへのアクセスを制御しながら、このデータの集約を他の Google Cloud プロジェクトに公開したいと考えています。さらに、全体的なストレージ コストを最小限に抑え、他のプロジェクトの分析コストがそれらのプロジェクトに確実に割り当てられるようにする必要があります。彼らは何をすべきでしょうか?
  • Professional-Data-Engineer 試験問題 32

    BigQuery によって処理される行数を減らすために使用できる方法はどれですか?
  • Professional-Data-Engineer 試験問題 33

    Cloud Datastore を使用して車両テレメトリ データをリアルタイムで取り込むことにしました。コストを低く抑えながら、長期的なデータの増加に対応できるストレージ システムを構築したいと考えています。また、ポイントインタイム(PIT)リカバリを作成したり、別の環境で Cloud Datastore 用にデータのコピーを作成したりできるように、データのスナップショットを定期的に作成したいと考えています。これらのスナップショットを長期間アーカイブしたいと考えています。
    これを達成できる 2 つの方法はどれですか? 答えを 2 つ選択してください。
  • Professional-Data-Engineer 試験問題 34

    Cloud Bigtable に依存するパフォーマンス テストを実行している場合は、以下の 1 つを除くすべての選択肢が推奨される手順です。推奨されない手順はどれですか?
  • Professional-Data-Engineer 試験問題 35

    あなたは自然言語処理ドメインで回帰問題に取り組んでおり、データセットには 1 億個のラベル付きサンプルがあります。データをランダムにシャッフルし、データセットをトレーニング サンプルとテスト サンプルに (90/10 の比率で) 分割しました。ニューラル ネットワークをトレーニングし、テスト セットでモデルを評価した後、モデルの二乗平均平方根誤差 (RMSE) がトレーニング セットではテスト セットの 2 倍であることがわかりました。モデルのパフォーマンスを向上するにはどうすればよいでしょうか?