Professional-Data-Engineer 試験問題 297

Google Dataflow SDK を使用して、以下に示すような顧客データを分析する予定です。プロジェクトの要件は、データソースから顧客名のみを抽出し、出力 PCollection に書き込むことです。
トム、555 X通り
ティム、553 Yストリート
サム、Z通り111番地
上記のデータ処理要件に最適な操作はどれですか?
  • Professional-Data-Engineer 試験問題 298

    キャンセルしたいジョブがあります。これはストリーミング パイプラインであり、処理中のデータを確実に処理して出力に書き込む必要があります。Dataflow モニタリング コンソールでパイプライン ジョブを停止するには、以下のどのコマンドを使用できますか?
  • Professional-Data-Engineer 試験問題 299

    リージョンBigOueryデータセットにデータを保存するためのフォールトトレラントアーキテクチャを設計しています。過去7日間にテーブルで発生した破損イベントからアプリケーションが確実に復旧できるようにする必要があります。RPO(目標復旧時点)が最も低く、費用対効果の高いソリューションであるマネージドサービスを導入したいと考えています。どうすればよいでしょうか?
  • Professional-Data-Engineer 試験問題 300

    Cloud Storage から BigQuery へのデータを処理する Dataflow パイプラインのトラブルシューティングを行っています。Dataflow ワーカーノードが相互に通信できないことが判明しました。ネットワーク チームは、Google Cloud ネットワーク タグを使用してファイアウォール ルールを定義しています。Google が推奨するネットワーク セキュリティ プラクティスに従いながら、この問題を特定する必要があります。どうすればよいでしょうか?
  • Professional-Data-Engineer 試験問題 301

    あなたは40万人以上の従業員を抱える大手ファストフードチェーンで働いています。従業員情報は、Google BigQueryのUsersテーブルに保存されており、FirstNameフィールドとLastNameフィールドで構成されています。IT部門の担当者がアプリケーションを構築しており、BigQueryのスキーマとデータを変更して、各従業員のFirstNameフィールドの値にスペースを連結し、それにLastNameフィールドの値を続けたFullNameフィールドをクエリできるようにしてほしいと依頼されました。コストを最小限に抑えながら、このデータを利用できるようにするにはどうすればよいでしょうか?