[2025-01-13更新,310問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer日本語関連対策(ページ 2)

Professional-Data-Engineer 試験問題 1

Dataflow を使用してストリーミングパイプラインを実行し、ホッピングウィンドウを使用して、データが到着するとデータをグループ化しています。一部のデータは遅れて到着しているものの、遅れたデータとしてマークされていないため、下流で集計が不正確になっていることに気付きました。適切なウィンドウで遅れたデータをキャプチャできるソリューションを見つける必要があります。どうすればよいでしょうか。

A. ウィンドウ関数をセッションウィンドウに変更して、特定のアクティビティに基づいてウィンドウを定義します。

B. ウィンドウ期間の重複を避けるために、ウィンドウ関数をタンブリングウィンドウに変更します。

C. ホッピングウィンドウを拡張して、遅れたデータがグループ内に到着するまでの時間を長くします。

D. ウォーターマークを使用して、予想されるデータ到着ウィンドウを定義します。遅れたデータが到着するとそれを許可します。

正解: D

ウォーターマークは、ストリーミングパイプラインの時間の経過を追跡する方法です。ウォーターマークは、ウィンドウを閉じて結果を発行できるタイミングを決定するために使用されます。ウォーターマークは、イベント時間ベースまたは処理時間ベースのいずれかになります。イベント時間ウォーターマークは、データ要素のタイムスタンプに基づいて時間の経過を追跡し、処理時間ウォーターマークは、システムクロックに基づいて時間の経過を追跡します。イベント時間ウォーターマークはより正確ですが、データソースが信頼性の高いタイムスタンプを提供する必要があります。処理時間ウォーターマークはよりシンプルですが、システム遅延やバックログの影響を受ける可能性があります。
ウォーターマークを使用すると、各ウィンドウ関数の予想されるデータ到着ウィンドウを定義できます。ウォーターマークを過ぎた後に到着するデータである遅延データの処理方法も指定できます。遅延データを破棄するか、遅延データを許可して新しいデータが到着したときに結果を更新することができます。遅延データを許可するには、トリガーを使用して結果が発行されるタイミングを制御する必要があります。
この場合、ウォーターマークを使用して遅延データを許可することが、適切なウィンドウで遅延データをキャプチャするための最善の解決策です。ウィンドウ関数をセッションウィンドウまたはタンブリングウィンドウに変更しても、ウィンドウを閉じるタイミングを決定するためにウォーターマークに依存しているため、遅延データの問題は解決されません。
ホッピングウィンドウを拡張すると遅延データの量が減る可能性がありますが、ウィンドウ関数のセマンティクスと結果も変更されます。
参考文献:
* ストリーミングパイプライン | Cloud Dataflow | Google Cloud
* ウィンドウ | Apache Beam

Professional-Data-Engineer 試験問題 2

すべての Google Cloud Bigtable クライアントリクエストはフロントエンドサーバーを経由して Cloud Bigtable ノードに送信されます。

A. 前

B. 後

C. の場合のみ

D. 1回

Professional-Data-Engineer 試験問題 3

ケーススタディ: 2、
フローロジスティックのケーススタディ
会社概要
Flowlogistic は、大手の物流およびサプライチェーンプロバイダーです。同社は、世界中の企業がリソースを管理し、最終目的地まで輸送するのを支援しています。同社は急速に成長し、鉄道、トラック、航空機、海上輸送を含むサービスを拡大しています。
会社概要
当社は地域のトラック運送会社としてスタートし、その後他の物流市場へ事業を拡大しました。
インフラストラクチャを更新していないため、注文と出荷の管理と追跡がボトルネックになっています。業務を改善するために、Flowlogistic は荷物レベルで出荷をリアルタイムで追跡する独自のテクノロジーを開発しました。しかし、Apache Kafka に基づくテクノロジースタックでは処理量に対応できないため、これを導入できません。さらに、Flowlogistic は注文と出荷をさらに分析して、リソースを最適に導入する方法を決定したいと考えています。
ソリューションコンセプト
Flowlogistic は、クラウドを使用して次の 2 つの概念を実装したいと考えています。
リアルタイムの在庫追跡システムで自社の独自技術を使用して、荷物の位置を示します。構造化データと非構造化データの両方を含むすべての注文と出荷ログを分析し、リソースを最も効果的に配備する方法、どの市場に情報を展開するかを決定します。また、予測分析を使用して、出荷が遅れる時期を早めに把握したいと考えています。
既存の技術環境
Flowlogistic アーキテクチャは単一のデータセンターに存在します。
データベース
2 つのクラスターに 8 台の物理サーバー
SQL Server - ユーザーデータ、インベントリ、静的データ
物理サーバー 3 台
Cassandra - メタデータ、メッセージ追跡
10 台の Kafka サーバー - メッセージの集約とバッチ挿入の追跡
アプリケーションサーバー - 顧客フロントエンド、注文/カスタム用のミドルウェア 20 台の物理サーバーにわたる 60 台の仮想マシン Tomcat - Java サービス Nginx - 静的コンテンツバッチサーバーストレージアプライアンス仮想マシン (VM) ホスト用の iSCSI ファイバーチャネルストレージエリアネットワーク (FC SAN) SQL サーバーストレージネットワーク接続ストレージ (NAS) イメージストレージ、ログ、バックアップ Apache Hadoop /Spark サーバーコアデータレイクデータ分析ワークロード
その他サーバー 20 台
Jenkins、監視、要塞ホスト、
ビジネス要件
Build a reliable and reproducible environment with scaled panty of production. Aggregate data in a centralized Data Lake for analysis Use historical data to perform predictive analytics on future shipments Accurately track every shipment worldwide using proprietary technology Improve business agility and speed of innovation through rapid provisioning of new resources Analyze and optimize architecture for performance in the cloud Migrate fully to the cloud if all other requirements are met Technical Requirements Handle both streaming and batch data Migrate existing Hadoop workloads Ensure architecture is scalable and elastic to meet the changing demands of the company.
Use managed services whenever possible
Encrypt data flight and at rest
Connect a VPN between the production data center and cloud environment SEO Statement We have grown so quickly that our inability to upgrade our infrastructure is really hampering further growth and efficiency. We are efficient at moving shipments around the world, but we are inefficient at moving data around.
We need to organize our information so we can more easily understand where our customers are and what they are shipping.
CTO Statement
IT has never been a priority for us, so as our data has grown, we have not invested enough in our technology. I have a good staff to manage IT, but they are so busy managing our infrastructure that I cannot get them to do the things that really matter, such as organizing our data, building the analytics, and figuring out how to implement the CFO' s tracking technology.
CFO Statement
Part of our competitive advantage is that we penalize ourselves for late shipments and deliveries. Knowing where out shipments are at all times has a direct correlation to our bottom line and profitability.
Additionally, I don't want to commit capital to building out a server environment.
Flowlogistic wants to use Google BigQuery as their primary analysis system, but they still have Apache Hadoop and Spark workloads that they cannot move to BigQuery. Flowlogistic does not know how to store the data that is common to both workloads. What should they do?

A. Store he common data in the HDFS storage for a Google Cloud Dataproc cluster.

B. Store the common data in BigQuery and expose authorized views.

C. Store the common data encoded as Avro in Google Cloud Storage.

D. Store the common data in BigQuery as partitioned tables.

Professional-Data-Engineer 試験問題 4

Cloud Dataproc では、_____ 課金により実際に使用した分だけ料金が請求されます。

A. 月ごと

B. 分単位

C. 週ごと

D. 時間ごと

Professional-Data-Engineer 試験問題 5

Cloud Dataproc クラスタでスケジュールに従って実行される Spark ジョブがいくつかあります。ジョブの中には順番に実行されるものもあれば、同時に実行されるものもあります。このプロセスを自動化する必要があります。どうすればよいでしょうか。

A. Cloud Dataproc ワークフローテンプレートを作成する

B. ジョブを実行するための初期化アクションを作成する

C. Cloud Composer で有向非巡回グラフを作成する

D. Cloud SDK を使用してクラスタを作成し、ジョブを実行し、クラスタを破棄する Bash スクリプトを作成します。

他のバージョン: 1047Google.Professional-Data-Engineer.v2024-06-07.q281; 887Google.Professional-Data-Engineer.v2023-09-15.q214; 1426Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 111SAP.C-BCFIN-2502.v2025-09-05.q12; 106Avaya.77201X.v2025-09-05.q58; 106Oracle.1Z0-1079-24.v2025-09-05.q19; 105NBMTM.BCMTMS.v2025-09-05.q33; 106Huawei.H19-423_V1.0.v2025-09-04.q138; 111Nokia.4A0-113.v2025-09-04.q69; 125Microsoft.PL-200.v2025-09-04.q112; 128PMI.PMI-200.v2025-09-04.q146; 118Huawei.H19-315-ENU.v2025-09-04.q101; 118CyberArk.CPC-SEN.v2025-09-03.q19

Professional-Data-Engineer 試験問題 1

Professional-Data-Engineer 試験問題 2

Professional-Data-Engineer 試験問題 3

Professional-Data-Engineer 試験問題 4

Professional-Data-Engineer 試験問題 5

PDFファイルをダウンロード