[2025-12-29更新,327問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer技術内容(ページ 36)

Professional-Data-Engineer 試験問題 171

社内のETLの開発と保守を担当するチームがあります。入力データにエラーがあるため、Dataflowジョブの1つが失敗しており、パイプラインの信頼性（パイプラインの信頼性を含む）を向上させる必要があります。
失敗したデータをすべて再処理できるようになります。
何をすべきでしょうか?

A. フィルタリングステップを追加して、今後このような種類のエラーをスキップし、ログからエラーのある行を抽出します。

B. データを変換し、ログからエラーのある行を抽出する try... catch ブロックを DoFn に追加します。

C. データを変換する try... catch ブロックを DoFn に追加し、エラーのある行を DoFn から直接 PubSub に書き込みます。

D. データを変換する DoFn に try... catch ブロックを追加し、sideOutput を使用して、後で PubSub に保存できる PCollection を作成します。

Professional-Data-Engineer 試験問題 172

ストリーミング API を介してデータが BigQuery にストリーミングされるレポート専用のデータウェアハウスを構築しています。Google のベストプラクティスに従い、データ用のステージングテーブルと本番環境テーブルの両方があります。取り込み部分とレポート部分のいずれのパフォーマンスにも影響を与えずに、マスターデータセットが 1 つだけになるようにするには、データの読み込みをどのように設計すればよいですか。

A. 追加のみのモデルであるステージングテーブルを用意し、ステージングに書き込まれた変更を3時間ごとに本番環境テーブルに更新します。

B. ステージングテーブルを用意し、ステージングされたデータを本番環境のテーブルに移動し、30分ごとにステージングテーブルの内容を削除します。

C. ステージングテーブルを用意し、ステージングされたデータを本番環境テーブルに移動し、ステージングテーブルの内容は3時間ごとに削除する

D. 追加のみのモデルであるステージングテーブルを用意し、ステージングに書き込まれた変更を90分ごとに本番テーブルに更新します。

Professional-Data-Engineer 試験問題 173

Cloud Bigtable ノードに障害が発生すると、____ が失われます。

A. すべてのデータ

B. データなし

C. 最後のトランザクション

D. 時間軸

Professional-Data-Engineer 試験問題 174

数日かけて、カンマ区切り値（CSV）ファイルからGoogle BigQueryのテーブルCLICK_STREAMにデータをロードしました。DT列にはクリックイベントのエポックタイムが格納されています。便宜上、すべてのフィールドをSTRING型として扱うシンプルなスキーマを選択しました。次に、サイトを訪問したユーザーのウェブセッション継続時間を計算し、そのデータ型をTIMESTAMPに変更したいと考えています。将来のクエリの計算コストを高くすることなく、移行の労力を最小限に抑えたいと考えています。どうすればよいでしょうか？

A. テーブル CLICK_STREAM のすべての行を返すクエリを作成し、組み込み関数を使用して列 DT の文字列を TIMESTAMP 値に変換します。このクエリを、列 TS が TIMESTAMP 型であるテーブル NEW_CLICK_STREAM に対して実行します。今後は、テーブル CLICK_STREAM ではなくテーブル NEW_CLICK_STREAM を参照します。その後、新しいデータはテーブル NEW_CLICK_STREAM にロードされます。

B. CLICK_STREAMテーブルにTIMESTAMP型の列TSを追加し、各行に列TSの数値を入力します。今後は列DTではなく列TSを参照してください。

C. テーブル「CLICK STREAM」に2つの列を追加します。TIMESTAMP型のTS列とBOOLEAN型のIS_NEW列です。すべてのデータを追加モードで再ロードします。追加した行ごとに、IS_NEWの値をtrueに設定します。今後のクエリでは、DT列ではなくTS列を参照し、WHERE句でIS_NEWの値がtrueになるようにします。

D. CLICK_STREAMテーブルを削除し、列DTisがTIMESTAMP型になるように再作成します。データを再ロードします。

E. ビュー CLICK_STREAM_V を作成します。このビューでは、列 DT の文字列が TIMESTAMP 値に変換されます。
今後はテーブル CLICK_STREAM ではなくビュー CLICK_STREAM_V を参照してください。

Professional-Data-Engineer 試験問題 175

最高のパフォーマンスを得るために、Compute Engine インスタンスと Cloud Bigtable インスタンスに推奨されるゾーンは何ですか。

A. Compute Engine インスタンスを Cloud Bigtable インスタンスから最も遠いゾーンに配置します。

B. Compute Engine インスタンスと Cloud Bigtable インスタンスの両方を異なるゾーンに配置させます。

C. Compute Engine インスタンスと Cloud Bigtable インスタンスの両方を同じゾーンに配置します。

D. Cloud Bigtable インスタンスを、データのすべてのコンシューマーと同じゾーンに配置します。

他のバージョン: 607Google.Professional-Data-Engineer.v2026-05-11.q113; 2362Google.Professional-Data-Engineer.v2025-01-13.q310; 2390Google.Professional-Data-Engineer.v2024-06-07.q281; 1929Google.Professional-Data-Engineer.v2023-09-15.q214; 2288Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 122Workday.Workday-Pro-Talent-and-Performance.v2026-06-20.q18; 155Fortinet.NSE4_FGT_AD-7.6.v2026-06-20.q64; 141EMC.D-ISM-FN-01.v2026-06-20.q22; 149F5.F5CAB5.v2026-06-19.q20; 150SAP.C_P2W52_2410.v2026-06-19.q29; 145Scrum.PSM-III.v2026-06-18.q13; 171Oracle.1z0-1033-25.v2026-06-18.q45; 157Salesforce.Mule-101.v2026-06-17.q19; 166Citrix.1Y0-204.v2026-06-17.q142; 307CrowdStrike.CCCS-203b.v2026-06-16.q114

Professional-Data-Engineer 試験問題 171

Professional-Data-Engineer 試験問題 172

Professional-Data-Engineer 試験問題 173

Professional-Data-Engineer 試験問題 174

Professional-Data-Engineer 試験問題 175

PDFファイルをダウンロード