Professional-Data-Engineer 試験問題 211
既存のオンプレミスデータの一部をGoogle Cloud上のBigQueryにロードする予定です。ユースケースに応じて、ストリーミングまたはバッチロードのいずれかでデータをロードしたいと考えています。さらに、BigQueryにロードする前に、一部の機密データをマスキングしたいと考えています。コストを最小限に抑えながら、プログラム的にこれを実現する必要があります。どうすればよいでしょうか?
Professional-Data-Engineer 試験問題 212
BigQueryにあるあなたの会社のcustomer_orderテーブルには、1,000万人の顧客の注文履歴が保存されており、テーブルサイズは10PBです。サポートチームが注文履歴を閲覧するためのダッシュボードを作成する必要があります。ダッシュボードには、countrynameとusernameという2つのフィルターがあります。どちらもBigQueryテーブルの文字列データ型です。フィルターが適用されると、ダッシュボードはテーブルから注文履歴を取得し、クエリ結果を表示します。
ただし、次のクエリにフィルターを適用すると、ダッシュボードに結果が表示されるまでに時間がかかります。

より高速なアクセスをサポートするには、BigQuery テーブルをどのように再設計すればよいでしょうか?
ただし、次のクエリにフィルターを適用すると、ダッシュボードに結果が表示されるまでに時間がかかります。

より高速なアクセスをサポートするには、BigQuery テーブルをどのように再設計すればよいでしょうか?
Professional-Data-Engineer 試験問題 213
あなたはeコマース企業向けのカート放棄システムを設計しています。このシステムは、以下のルールに基づいてユーザーにメッセージを送信します。
1時間、サイト上でユーザーによるインタラクションがない

30ドル以上の商品をカートに追加した

取引
Google Cloud Dataflow を使用してデータを処理し、メッセージを送信するかどうかを決定します。パイプラインはどのように設計すればよいでしょうか?
1時間、サイト上でユーザーによるインタラクションがない

30ドル以上の商品をカートに追加した

取引
Google Cloud Dataflow を使用してデータを処理し、メッセージを送信するかどうかを決定します。パイプラインはどのように設計すればよいでしょうか?
Professional-Data-Engineer 試験問題 214
組織内の各分析チームは、それぞれのプロジェクトでBigQueryジョブを実行しています。各チームがプロジェクト内のスロット使用状況を監視できるようにしたいと考えています。どうすればよいでしょうか?
Professional-Data-Engineer 試験問題 215
ペタバイト規模の分析データがあり、それを保存するストレージおよび処理プラットフォームを設計する必要があります。Google Cloud 上のデータに対してデータウェアハウス形式の分析を実行し、データセットをファイルとして他のクラウド プロバイダのバッチ分析ツールに公開する必要があります。どうすればよいでしょうか?

