[2025-01-13更新,310問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer日本語関連対策(ページ 25)

Professional-Data-Engineer 試験問題 116

BigQuery ジョブを実行するプロジェクトが 2 つあります。
* あるプロジェクトでは、完了時間の SLA が厳格に定められた運用ジョブを実行しています。これらは優先度の高いジョブであり、必要なときに必要なコンピューティングリソースを利用できる必要があります。これらのジョブの使用率は、通常 300 スロットを下回ることはありませんが、時折、さらに 500 スロットまで急上昇することがあります。
* もう 1 つのプロジェクトは、ユーザーがアドホック分析クエリを実行するためのものです。このプロジェクトでは通常、一度に 200 を超えるスロットが使用されることはありません。これらのアドホッククエリは、スロット容量ではなく、ユーザーがスキャンするデータの量に基づいて課金されるようにします。
両方のプロジェクトで適切なコンピューティングリソースが利用可能であることを確認する必要があります。どうすればよいでしょうか?

A. 両方のプロジェクトに対して単一の Enterprise Edition 予約を作成します。ベースラインを 300 スロットに設定します。最大 700 スロットまでの自動スケーリングを有効にします。

B. プロジェクトごとに 1 つずつ、合計 2 つの予約を作成します。SLA プロジェクトでは、ベースラインが 300 スロットの Enterprise Edition を使用し、最大 500 スロットまでの自動スケーリングを有効にします。アドホックプロジェクトでは、オンデマンド課金を構成します。

C. プロジェクトごとに 1 つずつ、合計 2 つの Enterprise Edition 予約を作成します。SLA プロジェクトの場合は、ベースラインを 300 スロットに設定し、最大 500 スロットの自動スケーリングを有効にします。アドホックプロジェクトの場合は、予約ベースラインを 0 スロットに設定し、ignore_idle_slot3 フラグを False に設定します。

D. プロジェクトごとに 1 つずつ、合計 2 つの Enterprise Edition 予約を作成します。SLA プロジェクトの場合は、ベースラインを 800 スロットに設定します。アドホックプロジェクトの場合は、最大 200 スロットの自動スケーリングを有効にします。

正解: B

厳格な SLA を伴う本番ジョブとアドホッククエリの両方で、コスト効率を維持しながら適切なコンピューティングリソースが利用できるようにするには、プロジェクトごとに個別の予約と課金モデルを設定するのが最善のアプローチです。オプション B が最適な選択である理由は次のとおりです。
SLA とアドホックプロジェクトの個別の予約:
2 つの個別の予約を作成することで、各プロジェクトのニーズに合わせた専用のリソース管理が可能になります。
実稼働プロジェクトでは、必要に応じてスケールアップできる保証されたスロットが必要ですが、アドホックプロジェクトでは、スキャンされたデータに基づくオンデマンド課金のメリットが得られます。
SLA プロジェクトのエンタープライズエディションの予約:
ベースラインを 300 スロットに設定すると、SLA プロジェクトに必要な最小限のリソースが確保されます。
最大 500 個の追加スロットの自動スケーリングを有効にすると、プロジェクトは SLA を損なうことなく、ワークロードの不定期な急増を処理できるようになります。
アドホックプロジェクトのオンデマンド課金:
アドホックプロジェクトにオンデマンド課金を使用すると、予約されたスロット容量ではなく、スキャンされたデータの量に基づいてユーザーに課金されるため、コスト効率が確保されます。
このモデルは、予測可能性が低く、利用率が低いことが多いアドホッククエリに適しています。
実装手順:
SLA プロジェクトのエンタープライズエディション予約を設定します。
ベースライン 300 スロットの予約を作成します。
自動スケーリングを有効にして、必要に応じて最大 500 個の追加スロットを許可します。
アドホックプロジェクトのオンデマンド課金を構成する:
アドホックプロジェクトが、クエリによってスキャンされたデータに基づいて課金されるオンデマンド課金を使用するように設定されていることを確認します。
監視と調整:
両方のプロジェクトの使用状況とパフォーマンスを継続的に監視し、構成がニーズを満たしていることを確認し、必要に応じて調整を行います。
参照：
BigQuery スロット予約
BigQuery オンデマンド料金

Professional-Data-Engineer 試験問題 117

あなたは、アプリケーションログファイルを1回に1つのログファイルにまとめる製造工場で働いています。
午前2時にログファイルを処理するGoogle Cloud Dataflowジョブを作成しました。
ログファイルが 1 日に 1 回、できるだけ安価に処理されるようにします。どうすればよいでしょうか。

A. 代わりに Google Cloud Dataproc を使用するように処理ジョブを変更します。

B. ログデータをすぐに処理できるように、Cloud Dataflow ジョブをストリーミングジョブとして構成します。

C. Google App Engine Cron サービスを使用して cron ジョブを作成し、Cloud Dataflow ジョブを実行します。

D. 毎朝オフィスに着いたら、Cloud Dataflow ジョブを手動で開始します。

Professional-Data-Engineer 試験問題 118

Cloud Bigtable は、非常に大量の ____________________________ を保存する場合に推奨されるオプションですか?

A. 非常に高いレイテンシを持つマルチキーデータ

B. 非常に低いレイテンシのマルチキーデータ

C. 非常に低いレイテンシの単一キーデータ

D. 非常に高いレイテンシを持つ単一キーデータ

Professional-Data-Engineer 試験問題 119

人間の顔が含まれているかどうかがラベル付けされた画像のデータセットがあるとします。このラベル付けされたデータセットを使用して画像内の人間の顔を認識するニューラルネットワークを作成するには、どのようなアプローチが最も効果的でしょうか。

A. K-means クラスタリングを使用してピクセル内の顔を検出します。

B. 特徴エンジニアリングを使用して、入力データに目、鼻、口の特徴を追加します。

C. 複数の隠し層を持つニューラルネットワークを作成してディープラーニングを使用し、顔の特徴を自動的に検出します。

D. ピクセルの入力層、隠し層、および 2 つのカテゴリの出力層を持つニューラルネットワークを構築します。

Professional-Data-Engineer 試験問題 120

フローロジスティックのケーススタディ
会社概要
Flowlogistic は、大手の物流およびサプライチェーンプロバイダーです。同社は、世界中の企業がリソースを管理し、最終目的地まで輸送するのを支援しています。同社は急速に成長し、鉄道、トラック、航空機、海上輸送を含むサービスを拡大しています。
会社概要
同社は地域のトラック輸送会社としてスタートし、その後他の物流市場に拡大しました。インフラストラクチャを更新していないため、注文と出荷の管理と追跡がボトルネックになっています。業務を改善するために、Flowlogistic は荷物レベルで出荷をリアルタイムで追跡する独自のテクノロジーを開発しました。しかし、Apache Kafka に基づくテクノロジースタックでは処理量に対応できないため、これを展開することができません。さらに、Flowlogistic は注文と出荷をさらに分析して、リソースを最も効果的に展開する方法を決定したいと考えています。
ソリューションコンセプト
Flowlogistic は、クラウドを使用して次の 2 つの概念を実装したいと考えています。
* 荷物の位置を示すリアルタイム在庫追跡システムに独自の技術を使用する
* 構造化データと非構造化データの両方を含むすべての注文と出荷ログを分析し、リソースを最も効果的に配備する方法、情報を拡張する市場を決定します。また、予測分析を使用して、出荷が遅れる時期を早めに把握したいと考えています。
既存の技術環境
Flowlogistic アーキテクチャは単一のデータセンターに存在します。
* データベース
- 2 つのクラスターに 8 台の物理サーバー
- SQL Server - ユーザーデータ、インベントリ、静的データ
- 物理サーバー 3 台
- Cassandra - メタデータ、メッセージ追跡
10 台の Kafka サーバー - メッセージの集約とバッチ挿入の追跡
* アプリケーションサーバー - 顧客フロントエンド、注文/カスタム用のミドルウェア
- 20台の物理サーバーにまたがる60台の仮想マシン
- Tomcat - Java サービス
- Nginx - 静的コンテンツ
- バッチサーバー
* ストレージ機器
- 仮想マシン (VM) ホスト用の iSCSI
- ファイバーチャネルストレージエリアネットワーク (FC SAN) - SQL サーバーストレージ
ネットワーク接続ストレージ (NAS) イメージストレージ、ログ、バックアップ
* 10台のApache Hadoop /Sparkサーバー
- コアデータレイク
- データ分析ワークロード
* その他サーバー 20 台
- Jenkins、監視、要塞ホスト、
ビジネス要件
* スケールされた生産範囲で信頼性が高く再現可能な環境を構築します。
* 分析のために集中化されたデータレイクにデータを集約する
* 過去のデータを使用して将来の出荷に関する予測分析を実行する
* 独自の技術を使用して、世界中のすべての出荷を正確に追跡します
* 新しいリソースを迅速にプロビジョニングすることで、ビジネスの俊敏性とイノベーションのスピードを向上
* クラウドでのパフォーマンスのためにアーキテクチャを分析し、最適化する
* 他のすべての要件が満たされている場合は、クラウドに完全に移行します
技術要件
* ストリーミングとバッチデータの両方を処理
* 既存のHadoopワークロードを移行する
* 会社の変化する需要を満たすために、アーキテクチャが拡張可能で弾力性があることを確認します。
* 可能な限りマネージドサービスを利用する
* 飛行中および保存中のデータを暗号化
実稼働データセンターとクラウド環境の間にVPNを接続する
SEOステートメント
当社は急速に成長したため、インフラストラクチャをアップグレードできないことが、さらなる成長と効率の妨げになっています。当社は、世界中への貨物の移動は効率的ですが、データの移動は非効率的です。
顧客がどこにいて、何を発送しているのかをより簡単に理解できるように、情報を整理する必要があります。
CTO 声明
IT は当社にとって優先事項ではありませんでした。そのため、データが増えてもテクノロジーに十分な投資ができませんでした。IT を管理する優秀なスタッフがいますが、彼らはインフラストラクチャの管理に忙しく、データの整理、分析の構築、CFO の追跡テクノロジーの実装方法の検討など、本当に重要な作業を行うことができません。
CFOの声明
弊社の競争上の優位性の一部は、出荷や配送の遅れに対して自分たちにペナルティを課すことです。出荷品がどこにあるかを常に把握することは、弊社の最終利益と収益性に直接関係しています。また、サーバー環境の構築に資本を投入したくありません。
Flowlogistic の経営陣は、現在の Apache Kafka サーバーではリアルタイム在庫追跡システムのデータ量を処理できないと判断しました。独自の追跡ソフトウェアにデータを供給する新しいシステムを Google Cloud Platform (GCP) 上に構築する必要があります。システムは、さまざまなグローバルソースからデータを取り込み、リアルタイムで処理およびクエリを実行し、データを確実に保存できる必要があります。どの GCP 製品の組み合わせを選択すればよいでしょうか。

A. Cloud Pub/Sub、Cloud Dataflow、Cloud Storage

B. Cloud Pub/Sub、Cloud Dataflow、ローカル SSD

C. Cloud Pub/Sub、Cloud SQL、Cloud Storage

D. クラウドロードバランシング、クラウドデータフロー、クラウドストレージ

E. Cloud Dataflow、Cloud SQL、Cloud Storage

他のバージョン: 546Google.Professional-Data-Engineer.v2026-05-11.q113; 871Google.Professional-Data-Engineer.v2025-12-29.q327; 2313Google.Professional-Data-Engineer.v2024-06-07.q281; 1855Google.Professional-Data-Engineer.v2023-09-15.q214; 2261Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 144Salesforce.Mule-Arch-201.v2026-06-13.q56; 131Fortinet.NSE7_SOC_AR-7.6.v2026-06-13.q26; 136HP.HPE0-G04.v2026-06-13.q33; 157CrowdStrike.CCFA-200b.v2026-06-13.q88; 163Salesforce.Mule-Dev-201.v2026-06-12.q88; 174WGU.Information-Technology-Management.v2026-06-12.q113; 286CuramSoftware.CS0-003.v2026-06-12.q520; 190Salesforce.NP-Con-101.v2026-06-11.q92; 191RealEstate.Maryland-Real-Estate-Salesperson.v2026-06-11.q107; 242Microsoft.AZ-204.v2026-06-11.q260

Professional-Data-Engineer 試験問題 116

Professional-Data-Engineer 試験問題 117

Professional-Data-Engineer 試験問題 118

Professional-Data-Engineer 試験問題 119

Professional-Data-Engineer 試験問題 120

PDFファイルをダウンロード