[2025-12-29更新,327問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer技術内容(ページ 41)

Professional-Data-Engineer 試験問題 196

アナリティクスチームは、いくつかの異なる指標に基づいて、どの顧客が再び貴社と取引する可能性が最も高いかを判断するためのシンプルな統計モデルを構築したいと考えています。チームは、Google Cloud Storage に格納されているデータを使用して、Apache Spark でモデルを実行したいと考えています。このジョブの実行には Google Cloud Dataproc の使用を推奨しています。テストの結果、このワークロードは 15 ノードのクラスタで約 30 分で実行でき、結果は Google BigQuery に出力されることが確認されました。このワークロードは毎週実行する予定です。
コストの観点からクラスターを最適化するにはどうすればよいでしょうか?

A. ジョブの実行速度を上げるためにワーカーノードでSSDを使用する

B. クラスタにプリエンプティブ仮想マシン (VM) を使用する

C. ワークロードを Google Cloud Dataflow に移行する

D. ジョブの実行速度を上げるために、メモリ容量の大きいノードを使用します。

Professional-Data-Engineer 試験問題 197

JdbclO を使用して Cloud SQL インスタンスからデータを抽出する Apache Beam パイプラインを開発しています。Google Cloud で 2 つのプロジェクトを実行しています。パイプラインはプロジェクト A の Dataflow にデプロイされ、実行されます。
Cloud SQL インスタンスはプロジェクト B で実行されており、パブリック IP アドレスを持っていません。パイプラインをデプロイした後、接続エラーのためパイプラインが Cloud SQL インスタンスからデータを抽出できないことに気付きました。これらのプロジェクトでは VPC Service Controls と共有 VPC が使用されていないことを確認しました。データがパブリックインターネットを経由しないようにしながら、このエラーを解決したいと考えています。どうすればよいでしょうか？

A. プロジェクト A とプロジェクト B の間に VPC ネットワークピアリングを設定します。ピアリングされたサブネット範囲がネットワーク上のすべてのインスタンスにアクセスできるようにするファイアウォールルールを追加します。

B. Dataflow ワーカーの外部 IP アドレスをオフにします。プロジェクト A で Cloud NAT を有効にします。

C. プロジェクト A とプロジェクト B の間に VPC ネットワークピアリングを設定します。ピアリングされたサブネット上のプロジェクト B に外部 IP アドレスのない Compute Engine インスタンスを作成し、Cloud SQL データベースへのプロキシサーバーとして機能します。

D. Dataflow ワーカーの外部 IP アドレスを、Cloud SOL インスタンスの承認済みネットワークとして追加します。

Professional-Data-Engineer 試験問題 198

あなたはeコマース企業向けのカート放棄システムを設計しています。このシステムは、以下のルールに基づいてユーザーにメッセージを送信します。
* 1時間、サイト上でユーザーによるインタラクションがない
* 30ドル以上の商品をカートに追加した
* 取引が完了していない
Google Cloud Dataflow を使用してデータを処理し、メッセージを送信するかどうかを決定します。パイプラインはどのように設計すればよいでしょうか？

A. 期間が 60 分のスライディングタイムウィンドウを使用します。

B. 60 分間の固定時間ウィンドウを使用します。

C. 60 分の遅延を持つ時間ベースのトリガーでグローバルウィンドウを使用します。

D. ギャップ時間が 60 分のセッションウィンドウを使用します。

Professional-Data-Engineer 試験問題 199

配送会社には、Apache Kafka ストリームにリアルタイムで送信されるライブパッケージ追跡データがあります。
その後、このデータはBigQueryに読み込まれます。社内のアナリストは、パッケージのライフサイクルにおける地理空間の傾向を分析するために、BigQueryの追跡データに対してクエリを実行したいと考えています。テーブルは元々、取り込み日によるパーティショニングで作成されていました。時間が経つにつれて、クエリの処理時間が増加しています。BigQueryのクエリパフォーマンスを向上させる変更を実装する必要があります。どうすればよいでしょうか？

A. BigQuery でパッケージ追跡 ID 列のクラスタリングを実装します。

B. 古いデータを Cloud Storage ファイルに階層化し、拡張テーブルを活用します。

C. パッケージの配達日にデータパーティションを使用してテーブルを再作成します。

D. BigQuery で取り込み日付列のクラスタリングを実装します。

Professional-Data-Engineer 試験問題 200

Dataflow パイプラインについて正しくないものは次のどれですか。

A. Dataflow パイプラインは Dataflow に結び付けられており、他のランナーでは実行できません。

B. Dataflow パイプラインは他の Google Cloud サービスからデータを消費できます

C. データフローパイプラインはJavaでプログラムできます

D. データフローパイプラインは統一されたプログラミングモデルを使用するため、ストリーミングとバッチデータソースの両方で動作します。

他のバージョン: 613Google.Professional-Data-Engineer.v2026-05-11.q113; 2376Google.Professional-Data-Engineer.v2025-01-13.q310; 2390Google.Professional-Data-Engineer.v2024-06-07.q281; 1938Google.Professional-Data-Engineer.v2023-09-15.q214; 2292Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 102Databricks.Databricks-Certified-Professional-Data-Engineer.v2026-06-22.q208; 117Oracle.1z0-1054-25.v2026-06-22.q64; 105Fortinet.NSE5_FSW_AD-7.6.v2026-06-22.q41; 103Salesforce.MC-202.v2026-06-22.q57; 107Nutanix.NCA-6.10.v2026-06-22.q43; 130Workday.Workday-Pro-Talent-and-Performance.v2026-06-20.q18; 157Fortinet.NSE4_FGT_AD-7.6.v2026-06-20.q64; 145EMC.D-ISM-FN-01.v2026-06-20.q22; 154F5.F5CAB5.v2026-06-19.q20; 154SAP.C_P2W52_2410.v2026-06-19.q29

Professional-Data-Engineer 試験問題 196

Professional-Data-Engineer 試験問題 197

Professional-Data-Engineer 試験問題 198

Professional-Data-Engineer 試験問題 199

Professional-Data-Engineer 試験問題 200

PDFファイルをダウンロード