[2025-01-13更新,310問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer日本語関連対策(ページ 32)

Professional-Data-Engineer 試験問題 151

6 か月以内に 2 PB の履歴データをオンプレミスのストレージアプライアンスから Cloud Storage に移動する必要がありますが、送信ネットワーク容量は 20 Mb/秒に制限されています。このデータを Cloud Storage に移行するにはどうすればよいでしょうか。

A. Transfer Appliance を使用してデータを Cloud Storage にコピーします

B. gsutil cp -J を使用して、Cloud Storage にアップロードするコンテンツを圧縮します。

C. 履歴データ用のプライベート URL を作成し、Storage Transfer Service を使用してデータを Cloud Storage にコピーします。

D. gsutil cp とともに trickle または ionice を使用して、gsutil が使用する帯域幅を 20 Mb/秒未満に制限し、実稼働トラフィックに干渉しないようにします。

Professional-Data-Engineer 試験問題 152

ワイド＆ディープラーニングモデルに関する次の記述のうち正しいものはどれですか？（選択してください）
2つの回答。

A. ワイドモデルは記憶に使用され、ディープモデルは一般化に使用されます。

B. ワイド＆ディープモデルの適切な用途は、レコメンデーションシステムです。

C. ワイドモデルは一般化に使用され、ディープモデルは記憶に使用されます。

D. ワイド＆ディープモデルは、小規模な線形回帰問題に適しています。

Professional-Data-Engineer 試験問題 153

会社用に新しいリアルタイムデータウェアハウスを構築しており、Google BigQuery ストリーミング挿入を使用します。データが 1 回だけ送信されるという保証はありませんが、データの各行に一意の ID とイベントタイムスタンプがあります。インタラクティブにデータをクエリするときに重複が含まれないようにする必要があります。どのクエリタイプを使用すればよいでしょうか。

A. タイムスタンプ列に ORDER BY DESK を含め、LIMIT を 1 に設定します。

B. 一意の ID 列とタイムスタンプ列に対して GROUP BY を使用し、値に対して SUM を使用します。

C. LAG ウィンドウ関数を、一意の ID による PARTITION と WHERE LAG IS NOT NULL とともに使用します。

D. ROW_NUMBER ウィンドウ関数を、一意の ID による PARTITION と WHERE row equals 1 とともに使用します。

Professional-Data-Engineer 試験問題 154

時系列トランザクションデータをコピーするデータパイプラインを作成し、データサイエンスチームが BigQuery 内からクエリを実行して分析できるようにする必要があります。1 時間ごとに、数千のトランザクションが新しいステータスで更新されます。初期データセットのサイズは 1.5 PB で、1 日あたり 3 TB ずつ増加します。データは高度に構造化されており、データサイエンスチームはこのデータに基づいて機械学習モデルを構築します。データサイエンスチームのパフォーマンスと使いやすさを最大化したいと考えています。採用すべき 2 つの戦略はどれですか (2 つ選択してください)。

A. トランザクションデータの毎日のスナップショットを Cloud Storage にコピーし、Avro ファイルとして保存します。BigQuery の外部データソースサポートを使用してクエリを実行します。

B. 可能な限りデータの構造を保持します。

C. BigQuery UPDATE を使用してデータセットのサイズをさらに縮小します。

D. ステータスの更新が BigQuery に更新されるのではなく追加されるデータパイプラインを開発します。

E. データを可能な限り非正規化します。

Professional-Data-Engineer 試験問題 155

フローロジスティックのケーススタディ
会社概要
Flowlogistic は、大手の物流およびサプライチェーンプロバイダーです。同社は、世界中の企業がリソースを管理し、最終目的地まで輸送するのを支援しています。同社は急速に成長し、鉄道、トラック、航空機、海上輸送を含むサービスを拡大しています。
会社概要
当社は地域のトラック運送会社としてスタートし、その後他の物流市場へ事業を拡大しました。
インフラストラクチャを更新していないため、注文と出荷の管理と追跡がボトルネックになっています。業務を改善するために、Flowlogistic は荷物レベルで出荷をリアルタイムで追跡する独自のテクノロジーを開発しました。しかし、Apache Kafka に基づくテクノロジースタックでは処理量に対応できないため、これを導入できません。さらに、Flowlogistic は注文と出荷をさらに分析して、リソースを最適に導入する方法を決定したいと考えています。
ソリューションコンセプト
Flowlogistic は、クラウドを使用して次の 2 つの概念を実装したいと考えています。
リアルタイム在庫追跡システムで独自の技術を使用し、在庫の位置を表示します。

彼らの荷物
構造化データと非構造化データの両方を含むすべての注文と出荷ログを分析する

データを収集し、リソースを最も効果的に配備する方法や、どの市場に情報を拡大するかを決定します。また、予測分析を使用して、出荷が遅れる時期を早めに把握したいと考えています。
既存の技術環境
Flowlogistic アーキテクチャは単一のデータセンターに存在します。
データベース

- 2 つのクラスターに 8 台の物理サーバー
- SQL Server - ユーザーデータ、インベントリ、静的データ
- 物理サーバー 3 台
- Cassandra - メタデータ、メッセージ追跡
10 台の Kafka サーバー - メッセージの集約とバッチ挿入の追跡
アプリケーションサーバー - 顧客フロントエンド、注文/カスタム用のミドルウェア

- 20台の物理サーバーにまたがる60台の仮想マシン
- Tomcat - Java サービス
- Nginx - 静的コンテンツ
- バッチサーバー
ストレージ機器

- 仮想マシン (VM) ホスト用の iSCSI
- ファイバーチャネルストレージエリアネットワーク (FC SAN) - SQL サーバーストレージ
ネットワーク接続ストレージ (NAS) イメージストレージ、ログ、バックアップ
10 台の Apache Hadoop /Spark サーバー

- コアデータレイク
- データ分析ワークロード
その他サーバー 20 台

- Jenkins、監視、要塞ホスト、
ビジネス要件
スケールされた生産範囲で信頼性が高く再現可能な環境を構築します。

分析のために集中化されたデータレイクにデータを集約する

過去のデータを使用して将来の出荷に関する予測分析を実行する

独自の技術を使用して世界中のすべての出荷を正確に追跡します

新しいリソースを迅速にプロビジョニングすることで、ビジネスの俊敏性とイノベーションのスピードを向上

クラウドでのパフォーマンスのためにアーキテクチャを分析して最適化する

他のすべての要件が満たされている場合は、クラウドに完全に移行します。

技術要件
ストリーミングとバッチデータの両方を処理

既存のHadoopワークロードを移行する

企業の変化する要求を満たすために、アーキテクチャが拡張可能で弾力性があることを確認します。

可能な限りマネージドサービスを利用する

飛行中および保存中のデータを暗号化

実稼働データセンターとクラウド環境の間にVPNを接続する
SEOステートメント
当社は急速に成長したため、インフラストラクチャをアップグレードできないことが、さらなる成長と効率の妨げになっています。当社は、世界中への貨物の移動は効率的ですが、データの移動は非効率的です。
顧客がどこにいて、何を発送しているのかをより簡単に理解できるように、情報を整理する必要があります。
CTO 声明
IT は当社にとって優先事項ではありませんでした。そのため、データが増えてもテクノロジーに十分な投資ができませんでした。IT を管理する優秀なスタッフがいますが、彼らはインフラストラクチャの管理に忙しく、データの整理、分析の構築、CFO の追跡テクノロジーの実装方法の検討など、本当に重要な作業を行うことができません。
CFOの声明
当社の競争上の優位性の一部は、出荷や配達の遅れに対して自らにペナルティを課すことです。出荷品がどこにあるかを常に把握することは、当社の最終利益と収益性に直接関係しています。
さらに、サーバー環境の構築に資本を投入したくありません。
Flowlogistic の経営陣は、現在の Apache Kafka サーバーではリアルタイム在庫追跡システムのデータ量を処理できないと判断しました。独自の追跡ソフトウェアにデータを供給する新しいシステムを Google Cloud Platform (GCP) 上に構築する必要があります。システムは、さまざまなグローバルソースからデータを取り込み、リアルタイムで処理およびクエリを実行し、データを確実に保存できる必要があります。どの GCP 製品の組み合わせを選択すればよいでしょうか。

A. Cloud Pub/Sub、Cloud SQL、Cloud Storage

B. Cloud Dataflow、Cloud SQL、Cloud Storage

C. クラウドロードバランシング、クラウドデータフロー、クラウドストレージ

D. Cloud Pub/Sub、Cloud Dataflow、ローカル SSD

E. Cloud Pub/Sub、Cloud Dataflow、Cloud Storage

他のバージョン: 546Google.Professional-Data-Engineer.v2026-05-11.q113; 873Google.Professional-Data-Engineer.v2025-12-29.q327; 2319Google.Professional-Data-Engineer.v2024-06-07.q281; 1856Google.Professional-Data-Engineer.v2023-09-15.q214; 2261Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 146Salesforce.Mule-Arch-201.v2026-06-13.q56; 132Fortinet.NSE7_SOC_AR-7.6.v2026-06-13.q26; 139HP.HPE0-G04.v2026-06-13.q33; 161CrowdStrike.CCFA-200b.v2026-06-13.q88; 165Salesforce.Mule-Dev-201.v2026-06-12.q88; 179WGU.Information-Technology-Management.v2026-06-12.q113; 294CuramSoftware.CS0-003.v2026-06-12.q520; 203Salesforce.NP-Con-101.v2026-06-11.q92; 191RealEstate.Maryland-Real-Estate-Salesperson.v2026-06-11.q107; 249Microsoft.AZ-204.v2026-06-11.q260

Professional-Data-Engineer 試験問題 151

Professional-Data-Engineer 試験問題 152

Professional-Data-Engineer 試験問題 153

Professional-Data-Engineer 試験問題 154

Professional-Data-Engineer 試験問題 155

PDFファイルをダウンロード