[2025-01-13更新,310問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer日本語関連対策(ページ 33)

Professional-Data-Engineer 試験問題 156

あなたの会社では、独自のシステムを使用して、6 時間ごとに在庫データをクラウドのデータ取り込みサービスに送信しています。送信されるデータには、いくつかのフィールドのペイロードと送信のタイムスタンプが含まれます。送信に関して懸念事項がある場合、システムはデータを再送信します。データを最も効率的に重複排除するにはどうすればよいでしょうか。

A. 各データエントリのハッシュ値を計算し、それをすべての履歴データと比較します。

B. 各データエントリのハッシュ値やその他のメタデータを格納するデータベーステーブルを維持します。

C. 各データエントリを個別のデータベースに主キーとして保存し、インデックスを適用します。

D. 各データエントリにグローバル一意識別子 (GUID) を割り当てます。

Professional-Data-Engineer 試験問題 157

プライベートユーザーデータを含む機密プロジェクトに取り組んでいます

A. サービスアカウントを作成し、コンサルタントがそのアカウントを使用してログオンできるようにします。

B. 社内で作業を行うために、Google Cloud Platform にプロジェクトを設定しました。外部コンサルタントが、プロジェクトの Google Cloud Dataflow パイプラインで複雑な変換のコーディングを支援します。ユーザーのプライバシーをどのように維持すればよいでしょうか。

C. コンサルタントにプロジェクトの閲覧者ロールを付与します。

D. コンサルタントにプロジェクトの Cloud Dataflow 開発者ロールを付与します。

E. コンサルタントが別のプロジェクトで作業できるように、匿名化されたデータのサンプルを作成します。

Professional-Data-Engineer 試験問題 158

ニューラルネットワークにカテゴリ特徴のカテゴリ間の関係を学習させるにはどうすればよいでしょうか?

A. マルチホット列を作成する

B. ワンホット列を作成する

C. ハッシュバケットを作成する

D. 埋め込み列を作成する

Professional-Data-Engineer 試験問題 159

スケーラブルな方法でデータを収集する必要がある新しいアプリケーションを構築しています。データは一日中アプリケーションから継続的に到着し、年末までに 1 日あたり約 150 GB の JSON データを生成することが予想されます。要件は次のとおりです。
* 生産者と消費者の分離
* 取り込んだ生のデータを、スペースとコスト効率に優れた方法で保存し、無期限に保存する
* ほぼリアルタイムのSQLクエリ
* 少なくとも 2 年間の履歴データを保持し、SQL でクエリを実行します。これらの要件を満たすにはどのパイプラインを使用する必要がありますか?

A. Cloud Pub/Sub にイベントを公開するアプリケーションを作成し、JSON イベントペイロードを Avro に変換してデータを Cloud Storage と BigQuery に書き込む Cloud Dataflow パイプラインを作成します。

B. API を提供するアプリケーションを作成します。API をポーリングし、データを gzip 圧縮された JSON ファイルとして Cloud Storage に書き込むツールを作成します。

C. Cloud Pub/Sub にイベントを公開するアプリケーションを作成し、Cloud Dataproc で Spark ジョブを作成して JSON データを Avro 形式に変換し、永続ディスクの HDFS に保存します。

D. Cloud SQL データベースに書き込んでデータを保存するアプリケーションを作成します。データベースの定期的なエクスポートを設定して、Cloud Storage に書き込み、BigQuery に読み込みます。

Professional-Data-Engineer 試験問題 160

次の条件を満たすクラウドネイティブの履歴データ処理システムを設計しています。
* 分析対象のデータは CSV、Avro、PDF 形式であり、Cloud Dataproc、BigQuery、Compute Engine などの複数の分析ツールからアクセスされます。
* ストリーミングデータパイプラインは毎日新しいデータを保存します。
* パフォーマンスはソリューションの要素ではありません。
* ソリューション設計では可用性を最大化する必要があります。
このソリューションのデータストレージをどのように設計すればよいでしょうか?

A. データをマルチリージョンの Cloud Storage バケットに保存します。Cloud Dataproc、BigQuery、Compute Engine を使用してデータに直接アクセスします。

B. データをリージョンの Cloud Storage バケットに保存します。Cloud Dataproc、BigQuery、Compute Engine を使用してバケットに直接アクセスします。

C. 高可用性を備えた Cloud Dataproc クラスタを作成します。データを HDFS に保存し、必要に応じて分析を実行します。

D. データを BigQuery に保存します。Cloud Dataproc および Compute Engine 上の BigQuery コネクタを使用してデータにアクセスします。

他のバージョン: 583Google.Professional-Data-Engineer.v2026-05-11.q113; 941Google.Professional-Data-Engineer.v2025-12-29.q327; 2370Google.Professional-Data-Engineer.v2024-06-07.q281; 1897Google.Professional-Data-Engineer.v2023-09-15.q214; 2282Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 129F5.F5CAB5.v2026-06-19.q20; 122SAP.C_P2W52_2410.v2026-06-19.q29; 130Scrum.PSM-III.v2026-06-18.q13; 146Oracle.1z0-1033-25.v2026-06-18.q45; 134Salesforce.Mule-101.v2026-06-17.q19; 146Citrix.1Y0-204.v2026-06-17.q142; 217CrowdStrike.CCCS-203b.v2026-06-16.q114; 151WGU.Operations-Management.v2026-06-16.q23; 206EC-COUNCIL.312-49v11.v2026-06-16.q204; 279Microsoft.PL-300.v2026-06-16.q439

Professional-Data-Engineer 試験問題 156

Professional-Data-Engineer 試験問題 157

Professional-Data-Engineer 試験問題 158

Professional-Data-Engineer 試験問題 159

Professional-Data-Engineer 試験問題 160

PDFファイルをダウンロード