[2025-01-13更新,310問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer日本語関連対策(ページ 42)

Professional-Data-Engineer 試験問題 201

You are creating a data model in BigQuery that will hold retail transaction data. Your two largest tables, sales_transation_header and sales_transation_line. have a tightly coupled immutable relationship. These tables are rarely modified after load and are frequently joined when queried. You need to model the sales_transation_header and sales_transation_line tables to improve the performance of data analytics queries.
What should you do?

A. Create a sal es_transaction table that Stores the sales_tran3action_header and sales_transaction_line data as a JSON data type.

B. Create a sale3_transaction table that holds the sales_transaction_header information as rows and the sales_transaction_line rows as nested and repeated fields.

C. Create a sale_transaction table that holds the sales_transaction_header and sales_transaction_line information as rows, duplicating the sales_transaction_header data for each line.

D. Create separate sales_transation_header and sales_transation_line tables and. when querying, specify the sales transition line first in the WHERE clause.

正解: B

BigQuery supports nested and repeated fields, which are complex data types that can represent hierarchical and one-to-many relationships within a single table. By using nested and repeated fields, you can denormalize your data model and reduce the number of joins required for your queries. This can improve the performance and efficiency of your data analytics queries, as joins can be expensive and require shuffling data across nodes.
Nested and repeated fields also preserve the data integrity and avoid data duplication. In this scenario, the sales_transaction_header and sales_transaction_line tables have a tightly coupled immutable relationship, meaning that each header row corresponds to one or more line rows, and the data is rarely modified after load.
Therefore, it makes sense to create a single sales_transaction table that holds the sales_transaction_header information as rows and the sales_transaction_line rows as nested and repeated fields. This way, you can query the sales transaction data without joining two tables, and use dot notation or array functions to access the nested and repeated fields. For example, the sales_transaction table could have the following schema:
Table
Field name
Type
Mode
id
INTEGER
NULL可能
注文時間
タイムスタンプ
NULL可能
顧客ID
整数
NULL可能
行項目
記録
繰り返し
行項目.sku
弦
NULL可能
行項目の数量
整数
NULL可能
行項目価格
フロート
NULL可能
各注文の合計金額を照会するには、次の SQL ステートメントを使用できます。
構文
SELECT id、SUM(line_items.quantity * line_items.price) AS total_amount
sales_transaction から
GROUP BY id;
AI によって生成されたコードです。慎重に確認して使用してください。詳細については FAQ をご覧ください。
参考文献:
* ネストされたフィールドと繰り返しフィールドを使用する
* BigQuery の説明: 結合、ネスト、繰り返しデータの操作
* BigQuery の配列 - クエリパフォーマンスを向上させ、ストレージを最適化する方法

Professional-Data-Engineer 試験問題 202

Flowlogistic は、リアルタイムの在庫追跡システムを展開しています。追跡デバイスはすべて荷物追跡メッセージを送信しますが、そのメッセージは Apache Kafka クラスタではなく、単一の Google Cloud Pub/Sub トピックに送信されます。その後、サブスクライバーアプリケーションがメッセージを処理してリアルタイムレポートを作成し、履歴分析のために Google BigQuery に保存します。荷物データを時間の経過とともに分析できるようにする必要があります。
どのようなアプローチを取るべきでしょうか?

A. Cloud Pub/Sub サブスクライバーアプリケーションで受信される各メッセージにタイムスタンプを添付します。

B. 各パブリッシャーデバイスから Clod Pub/Sub に送信される送信メッセージに、タイムスタンプとパッケージ ID を添付します。

C. BigQuery の NOW () 関数を使用して、イベントの時間を記録します。

D. Cloud Pub/Sub から自動的に生成されたタイムスタンプを使用してデータを順序付けます。

正解: B

トピック 3、MJTelco のケーススタディ
会社概要
MJTelco は、世界中で急速に成長しているがサービスが行き届いていない市場にネットワークを構築することを計画しているスタートアップ企業です。
同社は革新的な光通信ハードウェアの特許を保有しており、これらの特許に基づいて、安価なハードウェアで信頼性の高い高速バックボーンリンクを多数構築できます。
会社概要
経験豊富な通信会社の幹部によって設立された MJTelco は、宇宙での通信の課題を克服するために開発されたテクノロジーを使用しています。同社の業務の基盤となるのは、リアルタイム分析を推進し、機械学習を組み込んでトポロジを継続的に最適化する分散データインフラストラクチャを作成することです。ハードウェアは安価であるため、同社はネットワークを過剰に展開して、地域政治の変動が場所の可用性とコストに与える影響を考慮に入れることを計画しています。
同社の管理および運用チームは世界中に配置されており、システム内のデータコンシューマーとデータ提供者の間に多対多の関係を構築しています。慎重に検討した結果、パブリッククラウドがニーズをサポートするのに最適な環境であると判断しました。
ソリューションコンセプト
MJTelco は、自社のラボで概念実証 (PoC) プロジェクトを成功させています。同社には主に 2 つのニーズがあります。
* インストール数が 50,000 を超える場合に生成されるデータフローを大幅に増やせるように、PoC を拡張および強化します。
* 機械学習サイクルを改良して、トポロジ定義を制御するために使用する動的モデルを検証および改善します。
MJTelco は、実験の実行、新機能の導入、実稼働顧客へのサービス提供のニーズを満たすために、開発/テスト、ステージング、実稼働の 3 つの個別の運用環境も使用します。
ビジネス要件
* 予測不可能な分散型通信ユーザーコミュニティで必要なときに必要な場所でリソースをインスタンス化し、最小限のコストで実稼働環境を拡張します。
* 最先端の機械学習と分析を保護するために、独自のデータのセキュリティを確保します。
* 分散した研究員が分析するためのデータに信頼性とタイムリーなアクセスを提供する
* 顧客に影響を与えることなく、機械学習モデルの迅速な反復をサポートする分離された環境を維持します。
技術要件
テレメトリデータの安全かつ効率的な転送と保存を確保する
インスタンスを迅速に拡張して、それぞれ複数のフローを持つ 10,000 ～ 100,000 のデータプロバイダーをサポートします。
1 日あたり約 1 億件のレコードを保存し、最大 2 年間のデータを追跡するデータテーブルに対する分析とプレゼンテーションを可能にします。テレメトリフローと実稼働学習サイクルの両方でのデータパイプラインの問題を認識することに重点を置いた監視インフラストラクチャの迅速な反復をサポートします。
CEOの声明
当社のビジネスモデルは、特許、分析、動的機械学習に依存しています。当社の安価なハードウェアは信頼性が高くなるように構成されており、コスト面で有利です。信頼性と容量のコミットメントを満たすには、大規模な分散データパイプラインを迅速に安定化する必要があります。
CTO 声明
パブリッククラウドサービスは宣伝どおりに動作する必要があります。拡張可能で、データを安全に保つリソースが必要です。
また、データサイエンティストがモデルを慎重に研究し、迅速に適応できる環境も必要です。
データ処理には自動化が不可欠であるため、反復作業中に開発環境とテスト環境も機能させる必要があります。
CFOの声明
プロジェクトが大きすぎるため、データと分析に必要なハードウェアとソフトウェアを維持することはできません。また、多数のデータフィードを監視する運用チームを配置する余裕もないため、自動化とインフラストラクチャに頼ることになります。Google Cloud の機械学習により、定量的研究者はデータパイプラインの問題ではなく、価値の高い問題に取り組むことができます。

Professional-Data-Engineer 試験問題 203

最近の価格履歴に基づいて特定の株式の価格を予測する機械学習モデルを作成する場合、どのようなタイプの推定器を使用すればよいでしょうか?

A. 教師なし学習

B. リグレッサー

C. 分類子

D. クラスタリング推定器

Professional-Data-Engineer 試験問題 204

あなたの会社の経営者から銀行取引のデータベースを渡されました。各行には、ユーザー ID、取引タイプ、取引場所、取引金額が含まれています。彼らは、データにどのようなタイプの機械学習を適用できるかを調査するように依頼しています。どの 3 つの機械学習アプリケーションを使用できますか? (3 つ選択してください。)

A. 特徴の類似性に基づいてトランザクションを N 個のカテゴリに分割するクラスタリング。

B. どのトランザクションが不正である可能性が高いかを判断するための教師なし学習。

C. トランザクションの場所を予測するための強化学習。

D. トランザクションの場所を予測するための教師あり学習。

E. どのトランザクションが不正である可能性が高いかを判断するための教師あり学習。

F. トランザクションの場所を予測するための教師なし学習。

Professional-Data-Engineer 試験問題 205

Which Cloud Dataflow / Beam feature should you use to aggregate data in an unbounded data source every hour based on the time when the data entered the pipeline?

A. An hourly watermark

B. An event time trigger

C. The with Allowed Lateness method

D. A processing time trigger

他のバージョン: 579Google.Professional-Data-Engineer.v2026-05-11.q113; 921Google.Professional-Data-Engineer.v2025-12-29.q327; 2351Google.Professional-Data-Engineer.v2024-06-07.q281; 1883Google.Professional-Data-Engineer.v2023-09-15.q214; 2279Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 119Scrum.PSM-III.v2026-06-18.q13; 133Oracle.1z0-1033-25.v2026-06-18.q45; 127Salesforce.Mule-101.v2026-06-17.q19; 144Citrix.1Y0-204.v2026-06-17.q142; 178CrowdStrike.CCCS-203b.v2026-06-16.q114; 141WGU.Operations-Management.v2026-06-16.q23; 202EC-COUNCIL.312-49v11.v2026-06-16.q204; 258Microsoft.PL-300.v2026-06-16.q439; 152Fortinet.FCSS_LED_AR-7.6.v2026-06-16.q43; 212CheckPoint.156-215.82.v2026-06-15.q106

Professional-Data-Engineer 試験問題 201

Professional-Data-Engineer 試験問題 202

Professional-Data-Engineer 試験問題 203

Professional-Data-Engineer 試験問題 204

Professional-Data-Engineer 試験問題 205

PDFファイルをダウンロード