Professional-Data-Engineer 試験問題 96
現在オンプレミスで運用しているApache Hadoop環境をクラウドに移行する予定です。長時間実行されるバッチジョブに対して、フォールトトレラント性とコスト効率を最大限に高める必要があります。マネージドサービスを利用したいと考えています。どうすればよいでしょうか?
Professional-Data-Engineer 試験問題 97
BigQueryを集中分析プラットフォームとして利用しています。毎日新しいデータがロードされ、ETLパイプラインが元のデータを修正して最終ユーザーに提供するための準備をします。このETLパイプラインは定期的に修正されるためエラーが発生する可能性がありますが、エラーが2週間後に初めて検出されることもあります。これらのエラーから回復する方法を提供する必要があり、バックアップはストレージコストを考慮して最適化する必要があります。BigQueryでデータをどのように整理し、バックアップをどのように保存すればよいでしょうか?
Professional-Data-Engineer 試験問題 98
機械学習データセットをトレーニング データとテスト データに分割する必要があるのはなぜですか?
Professional-Data-Engineer 試験問題 99
ある列の可能な値をすべて知らない場合に、カテゴリ列を構成するために使用できる TensorFlow 関数はどれですか。
Professional-Data-Engineer 試験問題 100
Dataflow を使用して Cloud Storage から BigQuery にデータを処理するアーキテクチャを設計しています。
ネットワーク チームは、パイプラインで使用される共有 VPC ネットワークとサブネットワークを提供しました。
共有VPCネットワーク上でパイプラインのデプロイを有効にする必要があります。どうすればよいでしょうか?
ネットワーク チームは、パイプラインで使用される共有 VPC ネットワークとサブネットワークを提供しました。
共有VPCネットワーク上でパイプラインのデプロイを有効にする必要があります。どうすればよいでしょうか?
