[2025-12-29更新,327問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer技術内容(ページ 58)

Professional-Data-Engineer 試験問題 281

数百万台のコンピューターのCPUとメモリの使用状況を時系列で保存するためのデータベースを選択する必要があります。このデータは1秒間隔でサンプリングして保存する必要があります。アナリストは、このデータベースに対してリアルタイムのアドホック分析を実行することになります。クエリ実行ごとに課金されることを避け、スキーマ設計によってデータセットの将来的な拡張に対応できるようにする必要があります。どのデータベースとデータモデルを選択すべきでしょうか？

A. Cloud Bigtable に、コンピュータ ID と各分のサンプル時間を結合した行キーを持つワイドテーブルを作成し、各秒の値を列データとして結合します。

B. BigQuery で幅の広いテーブルを作成し、毎秒のサンプル値の列を作成し、毎秒の間隔で行を更新します。

C. BigQuery にテーブルを作成し、CPU とメモリの新しいサンプルをテーブルに追加します。

D. Cloud Bigtable に、Computer Engine のコンピュータ識別子と毎秒のサンプル時間を組み合わせた行キーを持つナローテーブルを作成します。

Professional-Data-Engineer 試験問題 282

Dataproc クラスタにプリエンプティブワーカーを追加するときに適用されるルールはどれですか (選択してください)
（2つの回答）？

A. プリエンプティブワーカーは永続ディスクを使用できません。

B. プリエンプティブワーカーはデータを保存できません。

C. プリエンプティブワーカーが再利用された場合は、代わりのワーカーを手動で追加する必要があります。

D. Dataproc クラスタにはプリエンプティブルワーカーのみを含めることはできません。

Professional-Data-Engineer 試験問題 283

HadoopジョブをオンプレミスクラスタからDataprocとGCSに移行しました。Sparkジョブは、多数のシャッフィング操作で構成される複雑な分析ワークロードであり、初期データはParquetファイル（平均
それぞれ200～400MBのサイズです。Dataprocへの移行後、パフォーマンスに若干の低下が見られるため、最適化を検討しています。組織はコスト重視であることを考慮し、このワークロードでは引き続きプリエンプティブ（非プリエンプティブワーカー2台のみ）でDataprocを使用する予定です。
何をすべきでしょうか?

A. HDD から SSD に切り替え、初期データを GCS から HDFS にコピーし、Spark ジョブを実行して結果を GCS にコピーします。

B. parquet ファイルのサイズを増やして、最低 1 GB になるようにします。

C. parquet ファイルの代わりに TFRecords 形式 (ファイルあたり約 200 MB) に切り替えます。

D. HDD から SSD に切り替え、プリエンプティブ VM の構成をオーバーライドしてブートディスクのサイズを増やします。

Professional-Data-Engineer 試験問題 284

インフラストラクチャチームが、Google Cloud とオンプレミスネットワーク間の相互接続リンクを設定しました。
オンプレミスでホストされているApache Kafkaクラスタからストリーミングでデータを取り込むための、高スループットのストリーミングパイプラインを設計しています。そして、可能な限りレイテンシを最小限に抑えながら、BigQueryにデータを保存したいと考えています。
何をすべきでしょうか?

A. Google Cloud の VPC 内のプロキシホストを使用して Kafka に接続します。Dataflow パイプラインを作成し、プロキシホストからデータを読み取り、BigQuery に書き込みます。

B. Kafka と Pub/Sub の間に Kafka Connect ブリッジを設定します。Google 提供の Dataflow テンプレートを使用して、Pub/Sub からデータを読み取り、BigQuery に書き込みます。

C. Kafka と Pub/Sub の間に Kafka Connect ブリッジを設定します。Dataflow パイプラインを作成し、Pub/Sub からデータを読み取り、BigQuery に書き込みます。

D. Dataflow を使用して、Kafka からデータを読み取り、BigQuery にデータを書き込むパイプラインを作成します。

正解: C

このソリューションが最適な理由と、他のソリューションが不十分な理由を詳しく説明します。
オプション C が最善の解決策である理由:
* Kafka Connect Bridge：このブリッジは、オンプレミスの Kafka クラスタと Google Cloud の Pub/Sub メッセージングサービス間の信頼性とスケーラビリティに優れた導管として機能します。相互接続リンクを介したデータの安全な転送に伴う複雑な処理を処理できます。
* バッファとしての Pub/Sub：Pub/Sub は、Kafka プロデューサーと Dataflow コンシューマーを分離する、非常にスケーラブルなバッファとして機能します。これは、メッセージ量の変動に対応し、スパイク発生時でもスムーズなデータフローを確保するために不可欠です。
* カスタム Dataflow パイプライン：カスタム Dataflow パイプラインを作成することで、BigQuery に書き込む前に、データに必要な変換やエンリッチメントを柔軟に実装できます。これは、実際のストリーミングシナリオで頻繁に必要となります。
* 最小限のレイテンシ: Pub/Sub をバッファとして使用し、効率的な処理のために Dataflow を使用することで、Kafka で生成されるデータと BigQuery でクエリできるようになるまでのレイテンシを最小限に抑えることができます。
他の選択肢が理想的ではない理由:
* オプション A: プロキシホストを使用すると、追加の障害ポイントが導入され、特に高スループットのストリーミングでボトルネックが発生する可能性があります。
* オプション B: Google が提供する Dataflow テンプレートは便利ですが、特定の変換や複雑なデータ構造の処理に必要なカスタマイズが不足している可能性があります。
* オプションD：DataflowはオンプレミスのKafkaクラスタにネイティブに接続できません。Kafkaから直接読み取るには複雑なネットワーク構成が必要になり、パフォーマンスの問題が発生する可能性があります。
追加の考慮事項:
* スキーマ管理：Kafka で生成されるデータのスキーマが、BigQuery で想定されるスキーマと互換性があることを確認します。スキーマの進化管理には、Schema Registry などのツールの使用を検討してください。
* 監視: メッセージのバックログや処理エラーなど、パイプライン内のあらゆる問題を検出するために、強力な監視とアラートを設定します。
オプション C に従うことで、Kafka Connect、Pub/Sub、Dataflow の長所を活用して、オンプレミスの Kafka データを BigQuery とシームレスに統合する、高スループットで低レイテンシのストリーミングパイプラインを作成できます。

Professional-Data-Engineer 試験問題 285

Cloud Bigtable は、Google の ______ ビッグデータデータベースサービスです。

A. リレーショナル

B. MySQL

C. NoSQL

D. SQL Server

他のバージョン: 1455Google.Professional-Data-Engineer.v2025-01-13.q310; 1483Google.Professional-Data-Engineer.v2024-06-07.q281; 1246Google.Professional-Data-Engineer.v2023-09-15.q214; 1699Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 161Google.Professional-Data-Engineer.v2025-12-29.q327; 112SAP.C_ARP2P_2508.v2025-12-29.q29; 110Appian.ACD201.v2025-12-29.q36; 226ServiceNow.CIS-HAM.v2025-12-27.q212; 160Pegasystems.PEGACPBA24V1.v2025-12-27.q118; 151Microsoft.DP-700.v2025-12-27.q84; 114EXIN.CITM.v2025-12-26.q18; 119Microsoft.GH-100.v2025-12-26.q24; 139PennsylvaniaRealEstateCommission.RePA_Sales_S.v2025-12-26.q37; 117SAP.C_BCBTM_2502.v2025-12-25.q10

Professional-Data-Engineer 試験問題 281

Professional-Data-Engineer 試験問題 282

Professional-Data-Engineer 試験問題 283

Professional-Data-Engineer 試験問題 284

Professional-Data-Engineer 試験問題 285

PDFファイルをダウンロード