[2025-01-13更新,310問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer日本語関連対策(ページ 51)

Professional-Data-Engineer 試験問題 246

ケーススタディ: 2 - MJTelco
会社概要
MJTelco は、世界中で急成長しているがサービスが行き届いていない市場にネットワークを構築することを計画しているスタートアップ企業です。同社は革新的な光通信ハードウェアの特許を保有しています。これらの特許に基づいて、同社は安価なハードウェアで信頼性の高い高速バックボーンリンクを多数構築できます。
会社概要
経験豊富な通信会社の幹部によって設立された MJTelco は、宇宙での通信の課題を克服するために開発されたテクノロジーを使用しています。同社の業務の基盤となるのは、リアルタイム分析を推進し、機械学習を組み込んでトポロジを継続的に最適化する分散データインフラストラクチャを作成することです。ハードウェアは安価であるため、同社はネットワークを過剰に展開して、地域政治が場所の可用性とコストに与える影響を考慮に入れることを計画しています。同社の管理および運用チームは世界中に配置されており、システム内のデータコンシューマーとデータ提供者の間に多対多の関係を構築しています。慎重に検討した結果、同社はパブリッククラウドがニーズをサポートするのに最適な環境であると判断しました。
ソリューションコンセプト
MJTelco は、自社のラボで概念実証 (PoC) プロジェクトを成功させています。同社には主に 2 つのニーズがあります。
インストール数が 50,000 を超えると、生成されるデータフローが大幅に増加するため、PoC を拡張して強化します。
機械学習サイクルを改良して、トポロジ定義を制御するために使用する動的モデルを検証および改善します。
MJTelco は、開発/テスト、ステージング、本番という 3 つの個別の運用環境も使用します。
実験の実行、新機能の導入、実稼働顧客へのサービス提供のニーズを満たすためです。
ビジネス要件
予測不可能な分散型通信ユーザーコミュニティで必要なときに必要な場所でリソースをインスタンス化し、最小限のコストで実稼働環境を拡張します。独自のデータのセキュリティを確保して、最先端の機械学習と分析を保護します。
分散した研究員からの分析用データへの信頼性が高くタイムリーなアクセスを提供し、顧客に影響を与えることなく機械学習モデルの迅速な反復をサポートする分離された環境を維持します。
技術要件
テレメトリデータの安全で効率的な転送と保存を確保し、インスタンスを迅速に拡張して、それぞれ複数のフローを持つ 10,000 ～ 100,000 のデータプロバイダーをサポートします。
約2年分のデータを追跡するデータテーブルに対する分析とプレゼンテーションを可能にします。
1日あたり1億件のレコード
テレメトリフローと実稼働学習サイクルの両方でのデータパイプラインの問題を認識することに重点を置いた監視インフラストラクチャの迅速な反復をサポートします。
CEOの声明
当社のビジネスモデルは、特許、分析、動的機械学習に依存しています。当社の安価なハードウェアは信頼性が高くなるように構成されており、コスト面で有利です。信頼性と容量のコミットメントを満たすには、大規模な分散データパイプラインを迅速に安定化する必要があります。
CTO 声明
当社のパブリッククラウドサービスは、宣伝どおりに機能する必要があります。拡張可能で、データを安全に保つリソースが必要です。また、データサイエンティストがモデルを慎重に研究し、迅速に適応できる環境も必要です。当社はデータの処理を自動化に依存しているため、反復しながら機能する開発環境とテスト環境も必要です。
CFOの声明
プロジェクトが大きすぎるため、データと分析に必要なハードウェアとソフトウェアを維持することはできません。
また、膨大なデータフィードを監視するために運用チームを配置する余裕はないため、自動化とインフラストラクチャに頼ることになります。Google Cloud の機械学習により、当社の定量研究者はデータパイプラインの問題ではなく、価値の高い問題に取り組むことができます。
MJTelco が 1 日に取り込むことに関心のあるレコードストリームを考えると、Google BigQuery のコストが増大することを懸念しています。MJTelco は、設計ソリューションの提供を求めています。必要なのは、tracking_table と呼ばれる 1 つの大きなデータテーブルです。さらに、毎日のイベントのきめ細かな分析を実行しながら、毎日のクエリのコストを最小限に抑えたいと考えています。また、ストリーミング取り込みも使用したいと考えています。どうすればよいですか?

A. 「tracking_table」というテーブルを作成し、DATE 列を含めます。

B. パターンtracking_table_YYYYMMDDに従って、各日のシャードテーブルを作成します。

C. tracking_table というパーティションテーブルを作成し、TIMESTAMP 列を含めます。

D. 日を表す TIMESTAMP 列を持つ、tracking_table というテーブルを作成します。

Professional-Data-Engineer 試験問題 247

次の要件を満たす運用チーム向けの視覚化を作成する必要があります。
どのアプローチが要件を満たしていますか?

A. データを Google BigQuery テーブルに読み込み、データに接続して指標を計算し、フィルタ式を使用してテーブル内の最適でない行のみを表示する Google Data Studio 360 レポートを作成します。

B. データを Google BigQuery テーブルに読み込み、データをクエリし、指標を計算し、Google スプレッドシートのテーブルに最適でない行のみを表示する Google Apps Script を記述します。

C. データを Google Cloud Datastore テーブルに読み込み、すべての行をクエリし、関数を適用して指標を導出する Google App Engine アプリケーションを記述し、Google チャートと視覚化 API を使用して結果をテーブルにレンダリングします。

D. データを Google スプレッドシートに読み込み、数式を使用して指標を計算し、フィルタ/並べ替えを使用して、最適でないリンクのみをテーブルに表示します。

Professional-Data-Engineer 試験問題 248

You want to schedule a number of sequential load and transformation jobs Data files will be added to a Cloud Storage bucket by an upstream process There is no fixed schedule for when the new data arrives Next, a Dataproc job is triggered to perform some transformations and write the data to BigQuery. You then need to run additional transformation jobs in BigQuery The transformation jobs are different for every table These jobs might take hours to complete You need to determine the most efficient and maintainable workflow to process hundreds of tables and provide the freshest data to your end users. What should you do?

A. 1Create an Apache Airflow directed acyclic graph (DAG) in Cloud Composer with sequential tasks by using the Cloud Storage. Dataproc. and BigQuery operators
2 Use a single shared DAG for all tables that need to go through the pipeline
3 Schedule the DAG to run hourly

B. 1 Create an Apache Airflow directed acyclic graph (DAG) in Cloud Composer with sequential tasks by using the Dataproc and BigQuery operators.
2 Create a separate DAG for each table that needs to go through the pipeline
3 Use a Cloud Storage object trigger to launch a Cloud Function that triggers the DAG

C. 1 Create an Apache Airflow directed acyclic graph (DAG) in Cloud Composer with sequential tasks by using the Cloud Storage, Dataproc. and BigQuery operators
2 Create a separate DAG for each table that needs to go through the pipeline
3 Schedule the DAGs to run hourly

D. 1 Create an Apache Airflow directed acyclic graph (DAG) in Cloud Composer with sequential tasks by using the Dataproc and BigQuery operators
2 Use a single shared DAG for all tables that need to go through the pipeline.
3 Use a Cloud Storage object trigger to launch a Cloud Function that triggers the DAG

正解: B

このオプションは、各テーブルを個別に処理し、Cloud Storage バケットに新しいデータが到着したときにのみ DAG をトリガーできるため、ユースケースにとって最も効率的でメンテナンスしやすいワークフローです。Dataproc および BigQuery 演算子を使用すると、各テーブルの読み込みジョブと変換ジョブを簡単にオーケストレーションし、これらのサービスのスケーラビリティとパフォーマンスを活用できます12。テーブルごとに個別の DAG を作成することで、各テーブルの変換ロジックとパラメータをカスタマイズし、単一の共有 DAG の複雑さとオーバーヘッドを回避できます3。Cloud Storage オブジェクトトリガーを使用すると、対応するテーブルの DAG をトリガーする Cloud Functions 関数を起動できるため、データができるだけ早く処理され、固定スケジュールで DAG を実行するためのアイドル時間とコストが削減されます4。
オプション A は、データの到着に関係なく DAG を 1 時間ごとに実行し、すべてのテーブルに単一の共有 DAG を使用するため、保守とデバッグが難しくなるため、効率的ではありません。オプション C も、DAG を 1 時間ごとに実行し、Cloud Storage オブジェクトトリガーを活用しないため、効率的ではありません。オプション D は、すべてのテーブルに単一の共有 DAG を使用し、バケットからのデータ取り込みを簡素化できる Cloud Storage 演算子を使用しないため、保守が困難です。参考資料:
* 1: Dataproc オペレーター | Cloud Composer | Google Cloud
* 2: BigQuery オペレーター | Cloud Composer | Google Cloud
* 3: サービスオーケストレーションにはワークフローまたは Cloud Composer を選択する | ワークフロー | Google Cloud
* 4: Cloud Storage オブジェクトトリガー | Cloud Functions ドキュメント | Google Cloud
* [5]: DAG のトリガー | Cloud Composer | Google Cloud
* [6]: クラウドストレージオペレーター | Cloud Composer | Google Cloud

Professional-Data-Engineer 試験問題 249

Cloud Bigtable 用の HBase Shell とは何ですか?

A. HBase シェルは、テーブルの作成や削除などの管理タスクを実行する GUI ベースのインターフェースです。

B. HBase シェルは、テーブルの作成や削除などの管理タスクを実行するコマンドラインツールです。

C. HBase シェルは、新しい仮想化インスタンスの作成や削除などの管理タスクを実行するハイパーバイザーベースのシェルです。

D. HBase シェルは、Cloud Bigtable インスタンスへのアクセスを許可するためのユーザーアカウント管理機能のみを実行するコマンドラインツールです。

Professional-Data-Engineer 試験問題 250

人間の顔が含まれているかどうかがラベル付けされた画像のデータセットがあるとします。このラベル付けされたデータセットを使用して画像内の人間の顔を認識するニューラルネットワークを作成するには、どのようなアプローチが最も効果的でしょうか。

A. K-means クラスタリングを使用してピクセル内の顔を検出します。

B. 特徴エンジニアリングを使用して、入力データに目、鼻、口の特徴を追加します。

C. 複数の隠し層を持つニューラルネットワークを作成してディープラーニングを使用し、顔の特徴を自動的に検出します。

D. ピクセルの入力層、隠し層、および 2 つのカテゴリの出力層を持つニューラルネットワークを構築します。

他のバージョン: 477Google.Professional-Data-Engineer.v2026-05-11.q113; 815Google.Professional-Data-Engineer.v2025-12-29.q327; 2241Google.Professional-Data-Engineer.v2024-06-07.q281; 1804Google.Professional-Data-Engineer.v2023-09-15.q214; 2244Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 105Oracle.1z0-1057-25.v2026-06-04.q45; 105Amazon.AWS-Certified-Developer-Associate.v2026-06-04.q323; 106Fortinet.FCSS_SDW_AR-7.4.v2026-06-04.q76; 131SAP.C_THR88_2505.v2026-06-03.q76; 149WGU.Web-Development-Applications.v2026-06-03.q73; 134Salesforce.Mule-Dev-301.v2026-06-02.q22; 181CISI.IFC.v2026-06-02.q111; 194Huawei.H13-611_V5.0.v2026-06-01.q113; 226Cisco.200-201.v2026-06-01.q230; 184Huawei.H35-211_V2.5.v2026-06-01.q109

Professional-Data-Engineer 試験問題 246

Professional-Data-Engineer 試験問題 247

Professional-Data-Engineer 試験問題 248

Professional-Data-Engineer 試験問題 249

Professional-Data-Engineer 試験問題 250

PDFファイルをダウンロード