[2025-12-29更新,327問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer技術内容(ページ 2)

Professional-Data-Engineer 試験問題 1

会社のデータアナリストチームは、Google Cloud プロジェクトで、2,000 スロットを予約したアドホッククエリとスケジュールされた SQL パイプラインに BigQuery を使用しています。しかし、最近、数百個の時間制約のない新しい SQL パイプラインを導入したため、チームは頻繁に割り当てエラーに遭遇しています。ログを調べたところ、ピーク時に約 1,500 件のクエリが同時にトリガーされていることがわかりました。この同時実行の問題を解決する必要があります。どうすればよいでしょうか？

A. SQL パイプラインとアドホッククエリを更新して、対話型クエリジョブとして実行します。

B. ベースラインを 0、最大予約サイズを 3000 にして、プロジェクトのスロット容量を増やします。

C. SOL パイプラインを更新してバッチクエリとして実行し、アドホッククエリを対話型クエリジョブとして実行します。

D. ベースラインを 2000、最大予約サイズを 3000 にして、プロジェクトのスロット容量を増やします。

正解: C

BigQuery で数百もの時間的制約のない SQL パイプラインの導入によって発生する同時実行の問題を解決するには、緊急性とリソース要件に基づいてクエリの種類を区別することが最善のアプローチです。オプション C が最適な選択肢である理由は次のとおりです。
バッチクエリとしての SQL パイプライン:
BigQuery のバッチクエリは、時間的制約のない操作向けに設計されています。優先度の低いキューで実行され、スロットをすぐに消費しないため、ピーク時の全体的なスロット消費量を削減できます。
時間的制約のない SQL パイプラインをバッチクエリに変換することで、スロット予約の負担を大幅に軽減できます。
インタラクティブクエリとしてのアドホッククエリ:
インタラクティブクエリは即時実行が優先され、ユーザーが迅速な結果を期待するアドホック分析に適しています。
アドホッククエリをインタラクティブジョブとして実行すると、アナリストは遅延なく結果を取得できるため、生産性とユーザー満足度が向上します。
同時実行管理:
このアプローチは、BigQuery のさまざまな種類のクエリを効率的に処理する機能を活用してワークロードのバランスをとるのに役立ち、スロットの枯渇による割り当てエラーが発生する可能性を減らします。
実装手順:
時間的制約のないパイプラインを識別する:
時間的に重要ではなく、バッチジョブとして実行できる SQL パイプラインを確認して識別します。
パイプラインをバッチクエリに更新します。
これらのパイプラインをバッチクエリとして実行するように変更します。これは、クエリジョブの優先度をBATCHに設定することで実行できます。
アドホッククエリがインタラクティブであることを確認する:
すべてのアドホッククエリが対話型ジョブとして送信され、高い優先度で実行され、スロットが即時に割り当てられるようにします。
参照：
BigQuery バッチクエリ
BigQuery スロットの割り当てと管理

Professional-Data-Engineer 試験問題 2

BigQuery によって処理される列の数を減らすために使用できる SQL キーワードはどれですか?

A. 間

B. どこ

C. 選択

D. 制限

Professional-Data-Engineer 試験問題 3

オンプレミスのApache Hadoopクラスタで数千ものApache Sparkジョブを実行しています。これらのジョブをGoogle Cloudに移行したいと考えています。長期運用のHadoopクラスタを自社で保守するのではなく、マネージドサービスを利用してジョブを実行したいと考えています。スケジュールが厳しく、コードの変更を最小限に抑えたいと考えています。どうすればよいでしょうか？

A. データを Compute Engine ディスクにコピーします。これらのインスタンス上でジョブを直接管理および実行します。

B. データを Cloud Storage に移動します。ジョブは Dataproc で実行します。

C. データをBigQueryに移行します。SparkスクリプトをSQLベースの処理方法に変換します。

D. Apache Beam でジョブを書き換えます。Dataflow でジョブを実行します。

正解: B

Dataproc と Apache Spark の互換性：Dataproc は、Google Cloud 上で Hadoop および Spark クラスタを実行するためのマネージドサービスです。つまり、最小限のコード変更で Apache Spark ジョブをシームレスに実行できるように設計されています。既存の Spark ジョブは、ほとんど、あるいは全く変更を加えることなく Dataproc 上で実行できます。
スケーラブルなデータレイクとしてのクラウドストレージ：クラウドストレージは、データのための高度にスケーラブルで耐久性の高いストレージソリューションを提供します。Sparkジョブが通常処理する大量のデータを処理できるように設計されています。
運用オーバーヘッドの最小化：Dataproc を使用すると、Hadoop クラスタを自社で管理・保守する必要がなくなります。インフラストラクチャは Google Cloud が管理するため、お客様はデータ処理タスクに集中できます。
タイトなスケジュールと最小限のコード変更：このオプションは、質問の要件に直接対応しています。既存のコードベースへの影響を最小限に抑えながら、SparkジョブをGoogle Cloudに迅速かつ簡単に移行できます。
他のオプションが適さない理由:
A. データをCompute Engineディスクにコピーします。これらのインスタンス上でジョブを直接管理・実行します。このオプションでは、基盤となるインフラストラクチャを自分で管理する必要があり、マネージドサービスを使用するという要件に反します。
C . データをBigQueryに移行します。SparkスクリプトをSQLベースの処理アプローチに変換します。BigQueryは強力なデータウェアハウスですが、SparkスクリプトをSQLに変換するには大幅なコード変更が必要となり、厳しいスケジュールでは実現できない可能性があります。
D . Apache Beam でジョブを書き換えます。Dataflow でジョブを実行します。Apache Beam でジョブを書き換えるのは大変な作業であり、最小限のコード変更で迅速に移行するには適していません。

Professional-Data-Engineer 試験問題 4

特定の条件が満たされた場合に、ウィンドウのコンテンツをいつ出力するかを決定するデータフロー概念は何ですか?

A. セッション

B. 出力基準

C. ウィンドウ

D. トリガー

Professional-Data-Engineer 試験問題 5

Google Cloud で新しいパイプラインを作成し、Cloud Pub/Sub から Cloud Dataflow を経由して BigQuery に IoT データをストリーミングしようとしています。データをプレビューしたところ、約 2% のデータが破損しているようです。この破損データを除外するには、Cloud Dataflow パイプラインを修正する必要があります。
a. 何をすべきでしょうか?

A. 破損した要素を破棄するには、Cloud Dataflow に ParDo 変換を追加します。

B. Cloud Dataflow にパーティション変換を追加して、有効なデータと破損したデータを分離します。

C. 要素が破損している場合にブール値を返す SideInput を追加します。

D. Cloud Dataflow に GroupByKey 変換を追加して、有効なデータをすべてグループ化し、残りを破棄します。

他のバージョン: 1451Google.Professional-Data-Engineer.v2025-01-13.q310; 1481Google.Professional-Data-Engineer.v2024-06-07.q281; 1234Google.Professional-Data-Engineer.v2023-09-15.q214; 1695Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 120Google.Professional-Data-Engineer.v2025-12-29.q327; 111SAP.C_ARP2P_2508.v2025-12-29.q29; 108Appian.ACD201.v2025-12-29.q36; 226ServiceNow.CIS-HAM.v2025-12-27.q212; 160Pegasystems.PEGACPBA24V1.v2025-12-27.q118; 151Microsoft.DP-700.v2025-12-27.q84; 114EXIN.CITM.v2025-12-26.q18; 119Microsoft.GH-100.v2025-12-26.q24; 137PennsylvaniaRealEstateCommission.RePA_Sales_S.v2025-12-26.q37; 117SAP.C_BCBTM_2502.v2025-12-25.q10

Professional-Data-Engineer 試験問題 1

Professional-Data-Engineer 試験問題 2

Professional-Data-Engineer 試験問題 3

Professional-Data-Engineer 試験問題 4

Professional-Data-Engineer 試験問題 5

PDFファイルをダウンロード