[2025-01-13更新,310問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer日本語関連対策(ページ 28)

Professional-Data-Engineer 試験問題 131

あなたの会社の経営者から銀行取引のデータベースが渡されました。各行には、ユーザーID、取引タイプ、取引場所、取引金額が含まれています。彼らは、データにどのようなタイプの機械学習を適用できるかを調査するように依頼しています。
a. 使用できる機械学習アプリケーションを 3 つ選択してください。(3 つ選択してください。)

A. トランザクションの場所を予測するための教師あり学習。

B. どのトランザクションが不正である可能性が高いかを判断するための教師あり学習。

C. トランザクションの場所を予測するための強化学習。

D. 特徴の類似性に基づいてトランザクションを N 個のカテゴリに分割するクラスタリング。

E. トランザクションの場所を予測するための教師なし学習。

F. どのトランザクションが不正である可能性が高いかを判断するための教師なし学習。

Professional-Data-Engineer 試験問題 132

デフォルトでは、Dataflow は次のウィンドウ動作のどれを無制限のデータセットに適用しますか?

A. Windows 100 MB のデータごとに

B. 単一、グローバルウィンドウ

C. 1分ごとにウィンドウ

D. 10分ごとにウィンドウ

Professional-Data-Engineer 試験問題 133

フローロジスティックのケーススタディ
会社概要
Flowlogistic は、大手の物流およびサプライチェーンプロバイダーです。同社は、世界中の企業がリソースを管理し、最終目的地まで輸送するのを支援しています。同社は急速に成長し、鉄道、トラック、航空機、海上輸送を含むサービスを拡大しています。
会社概要
同社は地域のトラック輸送会社としてスタートし、その後他の物流市場に拡大しました。インフラストラクチャを更新していないため、注文と出荷の管理と追跡がボトルネックになっています。業務を改善するために、Flowlogistic は荷物レベルで出荷をリアルタイムで追跡する独自のテクノロジーを開発しました。しかし、Apache Kafka に基づくテクノロジースタックでは処理量に対応できないため、これを展開することができません。さらに、Flowlogistic は注文と出荷をさらに分析して、リソースを最も効果的に展開する方法を決定したいと考えています。
ソリューションコンセプト
Flowlogistic は、クラウドを使用して次の 2 つの概念を実装したいと考えています。
* 荷物の位置を示すリアルタイム在庫追跡システムに独自の技術を使用する
* 構造化データと非構造化データの両方を含むすべての注文と出荷ログを分析し、リソースを最も効果的に配備する方法、情報を拡張する市場を決定します。また、予測分析を使用して、出荷が遅れる時期を早めに把握したいと考えています。
既存の技術環境
Flowlogistic アーキテクチャは単一のデータセンターに存在します。
* データベース
- 2 つのクラスターに 8 台の物理サーバー
- SQL Server - ユーザーデータ、インベントリ、静的データ
- 物理サーバー 3 台
- Cassandra - メタデータ、メッセージ追跡
10 台の Kafka サーバー - メッセージの集約とバッチ挿入の追跡
* アプリケーションサーバー - 顧客フロントエンド、注文/カスタム用のミドルウェア
- 20台の物理サーバーにまたがる60台の仮想マシン
- Tomcat - Java サービス
- Nginx - 静的コンテンツ
- バッチサーバー
* ストレージ機器
- 仮想マシン (VM) ホスト用の iSCSI
- ファイバーチャネルストレージエリアネットワーク (FC SAN) - SQL サーバーストレージ
ネットワーク接続ストレージ (NAS) イメージストレージ、ログ、バックアップ
* 10台のApache Hadoop /Sparkサーバー
- コアデータレイク
- データ分析ワークロード
* その他サーバー 20 台
- Jenkins、監視、要塞ホスト、
ビジネス要件
* スケールされた生産範囲で信頼性が高く再現可能な環境を構築します。
* 分析のために集中化されたデータレイクにデータを集約する
* 過去のデータを使用して将来の出荷に関する予測分析を実行する
* 独自の技術を使用して、世界中のすべての出荷を正確に追跡します
* 新しいリソースを迅速にプロビジョニングすることで、ビジネスの俊敏性とイノベーションのスピードを向上
* クラウドでのパフォーマンスのためにアーキテクチャを分析し、最適化する
* 他のすべての要件が満たされている場合は、クラウドに完全に移行します
技術要件
* ストリーミングとバッチデータの両方を処理
* 既存のHadoopワークロードを移行する
* 会社の変化する需要を満たすために、アーキテクチャが拡張可能で弾力性があることを確認します。
* 可能な限りマネージドサービスを利用する
* 飛行中および保存中のデータを暗号化
実稼働データセンターとクラウド環境の間にVPNを接続する
SEOステートメント
当社は急速に成長したため、インフラストラクチャをアップグレードできないことが、さらなる成長と効率の妨げになっています。当社は、世界中への貨物の移動は効率的ですが、データの移動は非効率的です。
顧客がどこにいて、何を発送しているのかをより簡単に理解できるように、情報を整理する必要があります。
CTO 声明
IT は当社にとって優先事項ではありませんでした。そのため、データが増えてもテクノロジーに十分な投資ができませんでした。IT を管理する優秀なスタッフがいますが、彼らはインフラストラクチャの管理に忙しく、データの整理、分析の構築、CFO の追跡テクノロジーの実装方法の検討など、本当に重要な作業を行うことができません。
CFOの声明
弊社の競争上の優位性の一部は、出荷や配送の遅れに対して自分たちにペナルティを課すことです。出荷品がどこにあるかを常に把握することは、弊社の最終利益と収益性に直接関係しています。また、サーバー環境の構築に資本を投入したくありません。
Flowlogistic の経営陣は、現在の Apache Kafka サーバーではリアルタイム在庫追跡システムのデータ量を処理できないと判断しました。独自の追跡ソフトウェアにデータを供給する新しいシステムを Google Cloud Platform (GCP) 上に構築する必要があります。システムは、さまざまなグローバルソースからデータを取り込み、リアルタイムで処理およびクエリを実行し、データを確実に保存できる必要があります。どの GCP 製品の組み合わせを選択すればよいでしょうか。

A. Cloud Pub/Sub、Cloud Dataflow、ローカル SSD

B. Cloud Pub/Sub、Cloud SQL、Cloud Storage

C. Cloud Dataflow、Cloud SQL、Cloud Storage

D. クラウドロードバランシング、クラウドデータフロー、クラウドストレージ

E. Cloud Pub/Sub、Cloud Dataflow、Cloud Storage

Professional-Data-Engineer 試験問題 134

Cloud Datastore を使用して、車両のテレメトリデータをリアルタイムで取り込むことにしました。コストを抑えながら、長期的なデータの増加に対応できるストレージシステムを構築したいと考えています。また、ポイントインタイム (PIT) リカバリを実行できるように、定期的にデータのスナップショットを作成したり、別の環境の Cloud Datastore のデータのコピーをクローンしたりしたいと考えています。これらのスナップショットを長期間アーカイブしたいと考えています。
これを実現できる 2 つの方法はどれですか? 2 つの回答を選択してください。

A. Cloud Datastore クライアントライブラリを使用してすべてのエンティティを読み取るアプリケーションを作成します。BigQuery ストリーミング挿入を介して各エンティティを BigQuery テーブルの行として扱います。各エクスポートにエクスポートタイムスタンプを割り当て、各行の追加列として添付します。エクスポートタイムスタンプ列を使用して BigQuery テーブルがパーティション分割されていることを確認します。

B. Cloud Datastore クライアントライブラリを使用してすべてのエンティティを読み取るアプリケーションを作成します。エクスポートされたデータを JSON ファイルにフォーマットします。データを Cloud Source Repositories に保存する前に圧縮を適用します。

C. マネージドエクスポートを使用し、そのエクスポート用に予約された一意の名前空間の下にある別のプロジェクトの Cloud Datastore にインポートします。

D. マネージドエクスポートを使用し、Nearline または Coldline クラスを使用してデータを Cloud Storage バケットに保存します。

E. マネージドエクスポートを使用し、そのエクスポート専用に作成された BigQuery テーブルにデータをインポートし、一時エクスポートファイルを削除します。

Professional-Data-Engineer 試験問題 135

Kafkaクラスタ経由でRedisクラスタにストリーミングデータを挿入します。両方のクラスタは
Compute Engine インスタンス。必要に応じて作成、ローテーション、破棄できる暗号化キーを使用して、保存中のデータを暗号化する必要があります。どうすればよいでしょうか。

A. Cloud Key Management Service で暗号化キーを作成します。Compute Engine クラスタインスタンスのデータにアクセスするときに、API サービス呼び出しでこれらのキーを参照します。

B. Cloud Key Management Service で暗号化キーを作成します。これらのキーを使用して、すべての Compute Engine クラスタインスタンス内のデータを暗号化します。

C. ローカルで暗号化キーを作成します。暗号化キーを Cloud Key Management Service にアップロードします。これらのキーを使用して、すべての Compute Engine クラスタインスタンス内のデータを暗号化します。

D. 専用のサービスアカウントを作成し、保存時に暗号化を使用して、
API サービス呼び出しの一部としての Compute Engine クラスタインスタンス。

他のバージョン: 546Google.Professional-Data-Engineer.v2026-05-11.q113; 871Google.Professional-Data-Engineer.v2025-12-29.q327; 2313Google.Professional-Data-Engineer.v2024-06-07.q281; 1855Google.Professional-Data-Engineer.v2023-09-15.q214; 2261Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 145Salesforce.Mule-Arch-201.v2026-06-13.q56; 131Fortinet.NSE7_SOC_AR-7.6.v2026-06-13.q26; 136HP.HPE0-G04.v2026-06-13.q33; 157CrowdStrike.CCFA-200b.v2026-06-13.q88; 163Salesforce.Mule-Dev-201.v2026-06-12.q88; 174WGU.Information-Technology-Management.v2026-06-12.q113; 286CuramSoftware.CS0-003.v2026-06-12.q520; 191Salesforce.NP-Con-101.v2026-06-11.q92; 191RealEstate.Maryland-Real-Estate-Salesperson.v2026-06-11.q107; 243Microsoft.AZ-204.v2026-06-11.q260

Professional-Data-Engineer 試験問題 131

Professional-Data-Engineer 試験問題 132

Professional-Data-Engineer 試験問題 133

Professional-Data-Engineer 試験問題 134

Professional-Data-Engineer 試験問題 135

PDFファイルをダウンロード