[2023-09-15更新,214問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer練習問題(ページ 6)

Professional-Data-Engineer 試験問題 21

あなたは、メディアストリーミングサービスであるモバイルアプリケーション用の新しいストレージシステムを展開しています。最適なのは Google Cloud Datastore であると判断します。複数のプロパティを持つエンティティがあり、その一部は複数の値を取ることができます。たとえば、エンティティ「Movie」では、プロパティ「actors」とプロパティ「tags」には複数の値がありますが、プロパティ「date release」には複数の値がありません。一般的なクエリでは、actor=<actorname> を持つすべての映画を date_release 順に並べるか、tag=Comedy を持つすべての映画を date_release 順に要求します。インデックス数の組み合わせ爆発をどのように回避すべきでしょうか?

A. オプション B。

B. オプション D

C. オプション C

D. オプション A

Professional-Data-Engineer 試験問題 22

オンプレミスの Hadoop システムを Cloud Dataproc に移行したいと考えています。Hive が主に使用されており、データ形式は Optimized Row Columnar (ORC) です。すべての ORC ファイルが Cloud Storage バケットに正常にコピーされました。パフォーマンスを最大化するには、一部のデータをクラスターのローカル Hadoop 分散ファイルシステム (HDFS) にレプリケートする必要があります。Cloud Dataproc で Hive の使用を開始する 2 つの方法は何ですか? (2つお選びください。)

A. gsutil ユーティリティを実行して、すべての ORC ファイルを Cloud Storage バケットから Dataproc クラスタの任意のノードに転送します。Hive テーブルをローカルにマウントします。

B. gsutil ユーティリティを実行して、すべての ORC ファイルを Cloud Storage バケットから HDFS に転送します。Hive テーブルをローカルにマウントします。

C. ORC ファイルを BigQuery に読み込みます。Hadoop 用の BigQuery コネクタを利用して、BigQuery テーブルを外部 Hive テーブルとしてマウントします。外部 Hive テーブルをネイティブテーブルにレプリケートします。

D. Hadoop 用の Cloud Storage コネクタを利用して、ORC ファイルを外部 Hive テーブルとしてマウントします。外部 Hive テーブルをネイティブテーブルにレプリケートします。

E. gsutil ユーティリティを実行して、すべての ORC ファイルを Cloud Storage バケットから Dataproc クラスタのマスターノードに転送します。次に、Hadoop ユーティリティを実行して、HDFS にコピーします。HDFS から Hive テーブルをマウントします。

Professional-Data-Engineer 試験問題 23

あなたは自動車メーカーに勤務しており、Google Cloud Pub/Sub を使用してデータパイプラインを設定してキャプチャを行っています。
異常なセンサーイベント。Cloud Pub/Sub でカスタム HTTPS を呼び出すプッシュサブスクリプションを使用している
これらの異常なイベントが発生したときに対処するために作成したエンドポイント。あなたのカスタム
HTTPS エンドポイントは、過剰な量の重複メッセージを取得し続けます。最も考えられる原因は何ですか
これらの重複メッセージは何ですか?

A. Cloud Pub/Sub トピックに発行されたメッセージが多すぎます。

B. センサーイベントのメッセージ本文が大きすぎます。

C. カスタムエンドポイントは、確認応答期限内にメッセージを確認していません。

D. カスタムエンドポイントに古い SSL 証明書があります。

Professional-Data-Engineer 試験問題 24

Dataflow プログラムをローカルで実行するために使用できる Java SDK クラスはどれですか?

A. ローカルランナー

B. DirectPipelineRunner

C. マシンランナー

D. LocalPipelineRunner

Professional-Data-Engineer 試験問題 25

データサイエンスチームが分析のために BigQuery 内からクエリできるように、時系列トランザクションデータをコピーするデータパイプラインを作成する必要があります。毎時間、何千ものトランザクションが新しいステータスで更新されます。初期データセットのサイズは 1.5 PB で、1 日あたり 3 TB ずつ増加します。データは高度に構造化されており、データサイエンスチームはこのデータに基づいて機械学習モデルを構築します。
ａ．データサイエンスチームのパフォーマンスと使いやすさを最大化したいと考えています。どの 2 つの戦略を採用する必要がありますか? 答えを 2 つ選択してください。

A. BigQuery UPDATE を使用して、データセットのサイズをさらに削減します。

B. データの構造を可能な限り保持します。

C. データを可能な限り非正規化します。

D. トランザクションデータの毎日のスナップショットを Cloud Storage にコピーし、Avro ファイルとして保存します。BigQuery の外部データソースのサポートを使用してクエリを実行します。

E. ステータス更新が更新されるのではなく BigQuery に追加されるデータパイプラインを開発します。

他のバージョン: 161Google.Professional-Data-Engineer.v2025-12-29.q327; 1455Google.Professional-Data-Engineer.v2025-01-13.q310; 1483Google.Professional-Data-Engineer.v2024-06-07.q281; 1699Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 161Google.Professional-Data-Engineer.v2025-12-29.q327; 112SAP.C_ARP2P_2508.v2025-12-29.q29; 110Appian.ACD201.v2025-12-29.q36; 226ServiceNow.CIS-HAM.v2025-12-27.q212; 160Pegasystems.PEGACPBA24V1.v2025-12-27.q118; 151Microsoft.DP-700.v2025-12-27.q84; 114EXIN.CITM.v2025-12-26.q18; 119Microsoft.GH-100.v2025-12-26.q24; 139PennsylvaniaRealEstateCommission.RePA_Sales_S.v2025-12-26.q37; 117SAP.C_BCBTM_2502.v2025-12-25.q10

Professional-Data-Engineer 試験問題 21

Professional-Data-Engineer 試験問題 22

Professional-Data-Engineer 試験問題 23

Professional-Data-Engineer 試験問題 24

Professional-Data-Engineer 試験問題 25

PDFファイルをダウンロード