[2023-09-15更新,214問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer練習問題(ページ 42)

Professional-Data-Engineer 試験問題 201

リアルタイムアプリケーションに Bigtable を使用していて、読み取りと書き込みが混在した重い負荷がかかっています。最近追加のユースケースを特定し、データベース全体にわたる特定の統計を計算する分析ジョブを 1 時間ごとに実行する必要があります。運用アプリケーションの信頼性と分析ワークロードの両方を確保する必要があります。
あなたは何をするべきか？

A. 既存のクラスターのサイズを 2 倍に増やし、サイズを変更した新しいクラスターで分析ワークロードを実行します。

B. Bigtable ダンプを GCS にエクスポートし、エクスポートされたファイル上で分析ジョブを実行します。

C. マルチクラスタールーティングを使用して既存のインスタンスに 2 番目のクラスターを追加し、通常のワークロードにはライブトラフィックアプリプロファイルを使用し、分析ワークロードにはバッチ分析プロファイルを使用します。

D. 単一クラスターのルーティングを使用して既存のインスタンスに 2 番目のクラスターを追加し、通常のワークロードにはライブトラフィックアプリプロファイルを使用し、分析ワークロードにはバッチ分析プロファイルを使用します。

Professional-Data-Engineer 試験問題 202

会社の顧客データベースと注文データベースには大きな負荷がかかることがよくあります。これにより、パフォーマンスが向上します
運用に影響を与えずにそれらに対する分析を行うことは困難です。データベースは MySQL クラスター内にあり、
mysqldump を使用して夜間にバックアップを取得します。運用への影響を最小限に抑えて分析を実行したいと考えています。
あなたは何をするべきか？

A. MySQL クラスターにノードを追加し、そこに OLAP キューブを構築します。

B. ETL ツールを使用して、MySQL から Google BigQuery にデータを読み込みます。

C. オンプレミスの Apache Hadoop クラスターを MySQL に接続し、ETL を実行します。

D. バックアップを Google Cloud SQL にマウントし、Google Cloud Dataproc を使用してデータを処理します。

Professional-Data-Engineer 試験問題 203

フローロジスティックのケーススタディ
会社概要
Flowlogistic は、物流およびサプライチェーンの大手プロバイダーです。これらは、世界中の企業がリソースを管理し、最終目的地に輸送するのに役立ちます。同社は急速に成長し、そのサービスを鉄道、トラック、航空機、海洋輸送にまで拡大しました。
会社背景
同社は地域のトラック運送会社としてスタートし、その後他の物流市場にも拡大しました。
インフラストラクチャを更新していないため、注文と出荷の管理と追跡がボトルネックになっています。業務を改善するために、Flowlogistic は荷物レベルでリアルタイムに出荷を追跡する独自のテクノロジーを開発しました。ただし、Apache Kafka に基づくテクノロジースタックが処理量をサポートできないため、これをデプロイすることはできません。さらに、Flowlogistic は注文と出荷をさらに分析して、リソースを最適に配置する方法を決定したいと考えています。
ソリューションコンセプト
Flowlogistic は、クラウドを使用して 2 つのコンセプトを実装したいと考えています。
独自のテクノロジーをリアルタイム在庫追跡システムに使用して、商品の位置を示します。

彼らの荷物
構造化と非構造化の両方を含むすべての注文と出荷ログの分析を実行します。

データを活用して、リソースを展開する最適な方法、どの市場を拡大するかを決定します。また、予測分析を使用して、出荷がいつ遅れるかを早期に把握したいと考えています。
既存の技術環境
フローロジスティックアーキテクチャは単一のデータセンターに存在します。
データベース

2 つのクラスターに 8 台の物理サーバー
- SQL Server - ユーザーデータ、インベントリ、静的データ
3 つの物理サーバー
- Cassandra - メタデータ、メッセージの追跡
10 台の Kafka サーバー - メッセージの集約とバッチ挿入の追跡
アプリケーションサーバー - 顧客フロントエンド、注文/通関用ミドルウェア

20 台の物理サーバーに 60 台の仮想マシン
- Tomcat - Java サービス
- Nginx - 静的コンテンツ
- バッチサーバー
ストレージアプライアンス

- 仮想マシン (VM) ホスト用の iSCSI
- ファイバーチャネルストレージエリアネットワーク (FC SAN) - SQL サーバーストレージ
- ネットワーク接続ストレージ (NAS) イメージストレージ、ログ、バックアップ
Apache Hadoop /Spark サーバー

- コアデータレイク
- データ分析ワークロード
20 のさまざまなサーバー

- Jenkins、モニタリング、要塞ホスト、
ビジネス要件
スケールの大きな実稼働環境を使用して、信頼性が高く再現可能な環境を構築します。

分析のために一元化されたデータレイクにデータを集約する

履歴データを使用して将来の出荷に関する予測分析を実行する

独自のテクノロジーを使用して世界中のすべての出荷を正確に追跡します

新しいリソースの迅速なプロビジョニングにより、ビジネスの機敏性とイノベーションの速度を向上させます。

クラウドでのパフォーマンスのためにアーキテクチャを分析して最適化する

他のすべての要件が満たされている場合は、クラウドに完全に移行します。

技術的要件
ストリーミングデータとバッチデータの両方を処理する

既存の Hadoop ワークロードを移行する

企業の変化する要求に対応できるように、アーキテクチャが拡張性と弾力性を備えていることを確認します。

可能な限りマネージドサービスを使用する

データフライトと保存時の暗号化

実稼働データセンターとクラウド環境の間で VPN を接続する

SEO ステートメント
当社は急速に成長してきたため、インフラストラクチャをアップグレードできないことが、さらなる成長と効率性を実際に妨げています。当社は世界中で荷物を効率的に移動させますが、データを移動させるのは非効率的です。
顧客がどこにいるのか、何を出荷しているのかをより簡単に理解できるように、情報を整理する必要があります。
CTO ステートメント
当社にとって IT はこれまで決して優先事項ではなかったので、データが増大する一方でテクノロジーへの投資が十分ではありませんでした。IT を管理する優秀なスタッフがいますが、彼らはインフラストラクチャの管理で忙しいため、データの整理、分析の構築、CFO の実装方法の検討など、本当に重要なことを彼らにやってもらうことができません。追跡技術。
CFO ステートメント
当社の競争上の優位性の 1 つは、出荷と配達の遅延に対してペナルティを課していることです。出荷品がどこにあるかを常に把握することは、当社の収益と収益性と直接的な相関関係があります。
さらに、サーバー環境の構築に資金を投入したくありません。
Flowlogistic は Google BigQuery を主要な分析システムとして使用したいと考えていますが、BigQuery に移行できない Apache Hadoop と Spark のワークロードがまだ残っています。Flowlogistic は、両方のワークロードに共通のデータを保存する方法を知りません。彼らは何をすべきでしょうか？

A. Avro としてエンコードされた共通データを Google Cloud Storage に保存します。

B. 共通データをパーティション分割テーブルとして BigQuery に保存します。

C. 共通データを BigQuery に保存し、承認されたビューを公開します。

D. 共通データを Google Cloud Dataproc クラスタの HDFS ストレージに保存します。

Professional-Data-Engineer 試験問題 204

リアルタイムアプリケーションに Bigtable を使用していて、読み取りと書き込みが混在した重い負荷がかかっています。
最近追加のユースケースを特定し、データベース全体にわたる特定の統計を計算する分析ジョブを 1 時間ごとに実行する必要があります。運用アプリケーションの信頼性と分析ワークロードの両方を確保する必要があります。
あなたは何をするべきか？

A. 単一クラスターのルーティングを使用して既存のインスタンスに 2 番目のクラスターを追加し、通常のワークロードにはライブトラフィックアプリプロファイルを使用し、分析ワークロードにはプロファイルを使用します。

B. 既存のクラスターのサイズを 2 倍に増やし、サイズ変更した新しいクラスターで分析ワークロードを実行します。

D. Bigtable ダンプを GCS にエクスポートし、エクスポートされたファイル上で分析ジョブを実行します。

Professional-Data-Engineer 試験問題 205

Cloud Bigtable の HBase Shell とは何ですか?

A. HBase シェルは、テーブルの作成や削除などの管理タスクを実行する GUI ベースのインターフェイスです。

B. HBase シェルは、テーブルの作成や削除などの管理タスクを実行するコマンドラインツールです。

C. HBase シェルは、新しい仮想化インスタンスの作成や削除などの管理タスクを実行するハイパーバイザーベースのシェルです。

D. HBase シェルは、Cloud Bigtable インスタンスへのアクセスを許可するユーザーアカウント管理機能のみを実行するコマンドラインツールです。

他のバージョン: 180Google.Professional-Data-Engineer.v2025-12-29.q327; 1458Google.Professional-Data-Engineer.v2025-01-13.q310; 1488Google.Professional-Data-Engineer.v2024-06-07.q281; 1700Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 180Google.Professional-Data-Engineer.v2025-12-29.q327; 112SAP.C_ARP2P_2508.v2025-12-29.q29; 112Appian.ACD201.v2025-12-29.q36; 226ServiceNow.CIS-HAM.v2025-12-27.q212; 163Pegasystems.PEGACPBA24V1.v2025-12-27.q118; 151Microsoft.DP-700.v2025-12-27.q84; 114EXIN.CITM.v2025-12-26.q18; 119Microsoft.GH-100.v2025-12-26.q24; 140PennsylvaniaRealEstateCommission.RePA_Sales_S.v2025-12-26.q37; 117SAP.C_BCBTM_2502.v2025-12-25.q10

Professional-Data-Engineer 試験問題 201

Professional-Data-Engineer 試験問題 202

Professional-Data-Engineer 試験問題 203

Professional-Data-Engineer 試験問題 204

Professional-Data-Engineer 試験問題 205

PDFファイルをダウンロード