[2025-12-29更新,327問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer技術内容(ページ 30)

Professional-Data-Engineer 試験問題 141

御社では、多数のニューロンと層を持つTensorFlowニューラルネットワークモデルを構築しました。このモデルはトレーニングデータには良好に適合しています。しかし、新しいデータでテストするとパフォーマンスが低下します。この問題を解決するには、どのような方法がありますか？

A. スレッド

B. シリアル化

C. ドロップアウトメソッド

D. 次元削減

Professional-Data-Engineer 試験問題 142

BigQueryオンデマンド環境を管理しています。ビジネスインテリジェンスツールは、大規模な（50TB）販売履歴ファクトテーブルを日単位と月単位で集計するクエリを毎日数百件送信しています。これらのクエリの応答時間が遅く、予想を超えるコストが発生しています。応答時間を短縮し、クエリコストを削減し、メンテナンスを最小限に抑える必要があります。どうすればよいでしょうか？

A. 売上テーブルの上にマテリアライズドビューを構築し、日レベルと月レベルでデータを集計します。

B. 売上テーブルの上に承認済みビューを構築し、日レベルと月レベルでデータを集計します。

C. Bl エンジンを有効にし、販売テーブルを優先テーブルとして追加します。

D. スケジュールされたクエリを作成して、売上日と売上月を 1 時間ごとに集計するテーブルを作成します。

正解: A

大規模な販売履歴ファクトテーブルを集計する頻繁なクエリの応答時間を改善し、コストを削減するには、マテリアライズド・ビューが非常に効果的なソリューションです。オプションAが最適な選択肢である理由は次のとおりです。
マテリアライズドビュー:
マテリアライズドビューはクエリの結果を物理的に保存し、定期的に更新することで、頻繁にアクセスされるデータに対するクエリ応答を高速化します。
これらは、結果を事前に計算することで、反復的でコストのかかる集計クエリのパフォーマンスを向上させるように設計されています。
効率性とコスト削減：
日レベルと月レベルでマテリアライズドビューを構築することで、各クエリに必要な計算が大幅に削減され、応答時間が短縮され、クエリコストが削減されます。
マテリアライズドビューは、大規模なデータセットを扱うときにコストがかかる可能性があるオンデマンドクエリ実行の必要性も軽減します。
最小限のメンテナンス:
BigQuery のマテリアライズドビューは自動的に管理され、更新はシステムによって処理されるため、チームのメンテナンス負担が軽減されます。
実装手順:
集計クエリを識別する:
既存のクエリを分析して、日レベルと月レベルでの共通の集計パターンを特定します。
マテリアライズドビューを作成する:
特定された集計パターンに対して、BigQuery でマテリアライズドビューを作成します。例: CREATE MATERIALIZED VIEW project.dataset.sales_daily_summary AS SELECT DATE(transaction_time) AS day, SUM(amount) AS total_sales FROM project.dataset.sales GROUP BY day; CREATE MATERIALIZED VIEW project.dataset.sales_monthly_summary AS SELECT EXTRACT(YEAR FROM transaction_time) AS year, EXTRACT(MONTH FROM transaction_time) AS month, SUM(amount) AS total_sales FROM project.dataset.sales GROUP BY year, month; マテリアライズドビューを使用したクエリ:
ベーステーブルを直接クエリするのではなく、マテリアライズドビューを使用するように既存のクエリを更新します。
参照：
BigQuery マテリアライズドビュー
クエリパフォーマンスの最適化

Professional-Data-Engineer 試験問題 143

Cloud Storage にデータを保存するアプリケーションのアーキテクチャを設計しています。アプリケーションは、生データを含む Cloud Storage バケットからデータを読み取り、処理後に別のバケットに書き込むパイプラインで構成されています。Google Cloud のリージョンで障害が発生した場合でも、復元力のある Cloud Storage リソースを備えたアーキテクチャを設計したいと考えています。障害発生時の復旧ポイント目標（RPO）を最小限に抑えつつ、保存されたデータを使用するアプリケーションに影響を与えないようにしたいと考えています。どうすればよいでしょうか？

A. 2 つのリージョン Cloud Storage バケットを採用し、両方のバケットに出力を書き込むようにアプリケーションを更新します。

B. アーキテクチャにマルチリージョンの Cloud Storage バケットを採用します。

C. 2 つのリージョン Cloud Storage バケットを採用し、一方のバケットからもう一方のバケットにコピーする毎日のタスクを作成します。

D. デュアルリージョンの Cloud Storage バケットを採用し、アーキテクチャでターボレプリケーションを有効にします。

正解: D

アプリケーションに影響を与えずに耐障害性を確保し、RPO（リカバリポイント目標）を最小限に抑えるには、ターボレプリケーションを備えたデュアルリージョンバケットを使用するのが最善のアプローチです。オプションDが最適な選択肢である理由は次のとおりです。
デュアルリージョンバケット:
デュアルリージョンバケットは、2 つの異なる地理的リージョンにわたってデータを冗長的に保存し、高い可用性と耐久性を実現します。
この設定により、1 つのリージョンで障害が発生してもデータが引き続き利用可能になります。
ターボレプリケーション:
ターボレプリケーションにより、復旧ポイント目標 (RPO) を最小限に抑えるという要件に合わせて、2 つのリージョン間で 15 分以内にデータがレプリケートされます。
この機能により、ほぼリアルタイムのレプリケーションが提供され、データ損失のリスクが大幅に軽減されます。
アプリケーションに影響なし:
アプリケーションは変更なしでデュアルリージョンバケットに引き続きアクセスするため、リージョン障害が発生した場合でもシームレスな操作が保証されます。
デュアルリージョン設定により、フェイルオーバーが透過的に処理され、データへの中断のないアクセスが提供されます。
実装手順:
デュアルリージョンバケットを作成します。
Google Cloud Console で適切なリージョン (例: us-central1 と us-east1) を選択して、デュアルリージョンの Cloud Storage バケットを作成します。
ターボレプリケーションを有効にする:
ターボレプリケーションを有効にすると、選択したリージョン間での高速なデータレプリケーションが保証されます。
アプリケーションを構成する:
アプリケーションがデュアルリージョンバケットに対して読み取りと書き込みを実行できるようにすることで、高い可用性と耐久性のメリットを享受できます。
テストフェイルオーバー:
リージョン障害をシミュレートして、デュアルリージョンバケットとターボレプリケーションが必要な RPO を満たし、データの復元力を確保していることを確認します。
参照：
Google Cloud Storage デュアルリージョン
Google Cloud Storage のターボレプリケーション

Professional-Data-Engineer 試験問題 144

メディアストリーミングサービスであるモバイルアプリケーション用の新しいストレージシステムをデプロイしています。最適なのはGoogle Cloud Datastoreだと判断しました。複数のプロパティを持つエンティティがあり、その中には複数の値を取ることができるものもあります。例えば、エンティティ「Movie」では、プロパティ「actors」とプロパティ「tags」は複数の値を取ることができますが、プロパティ「date released」は複数の値を取ることができません。一般的なクエリでは、actor=<actorname>を持つすべての映画をdate_released順に並べるか、tag=Comedyを持つすべての映画をdate_released順に並べるかのいずれかになります。インデックス数の組み合わせ爆発をどのように回避すればよいでしょうか？

A. オプションD

B. オプションA

C. オプションC

D. オプション B。

Professional-Data-Engineer 試験問題 145

Google Dataflow SDK を使用してソフトウェアアプリケーションを開発しており、条件分岐、for ループ、その他の複雑なプログラミング構造を使用して分岐パイプラインを作成したいと考えています。データ処理操作にはどのコンポーネントを使用しますか？

A. PCollection

B. 変換

C. パイプライン

D. シンクAPI

他のバージョン: 553Google.Professional-Data-Engineer.v2026-05-11.q113; 2293Google.Professional-Data-Engineer.v2025-01-13.q310; 2328Google.Professional-Data-Engineer.v2024-06-07.q281; 1867Google.Professional-Data-Engineer.v2023-09-15.q214; 2265Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 143CheckPoint.156-215.82.v2026-06-15.q106; 110Salesforce.AP-215.v2026-06-15.q22; 124Nutanix.NCP-MCI-6.10.v2026-06-15.q88; 121CompTIA.CV0-004.v2026-06-15.q237; 124Microsoft.MS-102.v2026-06-15.q316; 118Microsoft.AZ-900.v2026-06-15.q137; 121Microsoft.MB-240.v2026-06-15.q168; 122IAPP.CIPP-E.v2026-06-15.q260; 152Salesforce.Mule-Arch-201.v2026-06-13.q56; 137Fortinet.NSE7_SOC_AR-7.6.v2026-06-13.q26

Professional-Data-Engineer 試験問題 141

Professional-Data-Engineer 試験問題 142

Professional-Data-Engineer 試験問題 143

Professional-Data-Engineer 試験問題 144

Professional-Data-Engineer 試験問題 145

PDFファイルをダウンロード