Professional-Data-Engineer 試験問題 46
3 つのデータ処理ジョブを開発しました。1 つは、Cloud Storage にアップロードされたデータを変換し、結果を BigQuery に書き込む Cloud Dataflow パイプラインを実行します。2 つ目は、オンプレミス サーバーからデータを取り込み、Cloud Storage にアップロードします。3 つ目は、サードパーティ データ プロバイダから情報を取得し、その情報を Cloud Storage にアップロードする Cloud Dataflow パイプラインです。これら 3 つのワークフローの実行をスケジュールおよび監視し、必要に応じて手動で実行できる必要があります。あなたは何をするべきか?
Professional-Data-Engineer 試験問題 47
Cloud Dataprep を使用して、BigQuery テーブル内のデータのサンプルにレシピを作成しました。可変実行時間のロードジョブが完了した後、同じスキーマを使用したデータの毎日のアップロードでこのレシピを再利用したいと考えています。あなたは何をするべきか?
Professional-Data-Engineer 試験問題 48
BigQuery ソースを含むパイプラインをローカルマシンで実行すると、権限拒否エラーが引き続き発生します。その理由は何でしょうか?
Professional-Data-Engineer 試験問題 49
Hive を使用した Hadoop の代替となる Google Cloud Platform サービスはどれですか?
Professional-Data-Engineer 試験問題 50
あなたの会社では、1 時間あたり 20,000 個のファイルが作成されます。各データ ファイルはカンマ区切りの値としてフォーマットされます。
4 KB 未満の (CSV) ファイル。すべてのファイルは、事前に Google Cloud Platform に取り込まれる必要があります。
加工された。会社のサイトでは、Google Cloud とインターネット接続に対して 200 ミリ秒のレイテンシがあります
帯域幅は 50 Mbps に制限されます。現在、セキュア FTP (SFTP) サーバーを仮想マシンにデプロイしています。
データ取り込みポイントとしての Google Compute Engine。ローカル SFTP クライアントは専用マシン上で実行され、
CSVファイルをそのまま送信します。目標は、前日のデータを含むレポートを作成して、
幹部は毎日午前10時までに。このデザインは、たとえ現在のボリュームにかろうじて追いつくことができません。
ただし、帯域幅の使用率はかなり低いです。
季節性により、会社ではファイル数が今後 3 年間で 2 倍になると予想されていると言われました。
数か月。どの 2 つのアクションを取る必要がありますか? (2つお選びください。)
4 KB 未満の (CSV) ファイル。すべてのファイルは、事前に Google Cloud Platform に取り込まれる必要があります。
加工された。会社のサイトでは、Google Cloud とインターネット接続に対して 200 ミリ秒のレイテンシがあります
帯域幅は 50 Mbps に制限されます。現在、セキュア FTP (SFTP) サーバーを仮想マシンにデプロイしています。
データ取り込みポイントとしての Google Compute Engine。ローカル SFTP クライアントは専用マシン上で実行され、
CSVファイルをそのまま送信します。目標は、前日のデータを含むレポートを作成して、
幹部は毎日午前10時までに。このデザインは、たとえ現在のボリュームにかろうじて追いつくことができません。
ただし、帯域幅の使用率はかなり低いです。
季節性により、会社ではファイル数が今後 3 年間で 2 倍になると予想されていると言われました。
数か月。どの 2 つのアクションを取る必要がありますか? (2つお選びください。)
