[2025-12-29更新,327問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer技術内容(ページ 51)

Professional-Data-Engineer 試験問題 246

数百万台のモノのインターネット（IoT）デバイスから送信されるテレメトリデータを処理するために、NoSQLデータベースを選択しています。データ量は年間100TBのペースで増加しており、各データエントリには約100個の属性があります。データ処理パイプラインには、原子性、一貫性、独立性、永続性（ACID）は不要ですが、高可用性と低レイテンシは必要です。個々のフィールドに対してクエリを実行してデータを分析する必要があります。要件を満たすデータベースを3つ選択してください。

A. HBase

B. Hive を使用した HDFS

C. カサンドラ

D. MySQL

E. レディス

F. モンゴDB

Professional-Data-Engineer 試験問題 247

組織サンプルに関する情報データベースを用いて、将来の組織サンプルを正常か変異かに分類したいと考えています。組織サンプルの分類に教師なし異常検出法を適用したいと考えています。この方法を支持する2つの特性はどれですか？（2つ選択してください。）

A. 通常のサンプルと比較して、突然変異の発生は非常に少ないです。

B. データベースには、正常なサンプルと変異したサンプルがほぼ同数存在します。

C. 将来の突然変異は、データベース内の突然変異サンプルとは異なる特徴を持つことが予想されます。

D. 将来の突然変異は、データベース内の突然変異サンプルと同様の特徴を持つと予想されます。

E. データベースには、どのサンプルが変異しているか、どのサンプルが正常であるかを示すラベルがすでに存在します。

Professional-Data-Engineer 試験問題 248

あなたは広告会社に勤務しており、広告ブロックのクリックスルー率を予測する Spark ML モデルを開発しました。これまではすべてオンプレミスのデータセンターで開発していましたが、現在、Google Cloud への移行を進めています。データセンターは間もなく閉鎖されるため、迅速なリフト＆シフト方式の移行が必要です。ただし、これまで使用していたデータは BigQuery に移行されます。
Spark ML モデルを定期的に再トレーニングするため、既存のトレーニングパイプラインを Google Cloud に移行する必要があります。どうすればよいでしょうか。

A. 既存の Spark ML モデルのトレーニングには Cloud Dataproc を使用しますが、BigQuery から直接データを読み取り始めます。

B. TensorFlow でモデルを書き換え、Cloud ML Engine を使い始めましょう

C. 既存の Spark ML モデルのトレーニングに Cloud ML Engine を使用する

D. Compute Engine で Spark クラスタを起動し、BigQuery からエクスポートされたデータで Spark ML モデルをトレーニングします。

Professional-Data-Engineer 試験問題 249

Cloud Dataproc でサポートされているジョブタイプは次のどれですか (3 つ選択してください)。

A. ハイブ

B. 豚

C. ヤーン

D. スパーク

Professional-Data-Engineer 試験問題 250

組織内の様々なチームが、顧客データとパフォーマンスデータをBigOueryに保存しています。各チームは収集したデータを完全に管理し、プロジェクト内でデータクエリを実行し、他のチームとデータを交換できる必要があります。運用タスクとコストを最小限に抑えながら、組織全体にわたるソリューションを実装する必要があります。どうすればよいでしょうか？

A. すべての顧客データをチームプロジェクトに複製する BigQuery のスケジュールされたクエリを作成します。

B. 各チームがプロジェクトでアクセスする必要があるデータのマテリアライズドビューを作成できるようにします。

C. 各チームに Analytics Hub にデータを公開するよう指示します。他のチームにはデータをサブスクライブするよう指示します。

D. 各チームに、データの承認済みビューを作成するよう依頼します。各チームに biquery.jobUser ロールを付与します。

正解: C

組織全体でデータ交換を可能にしながら、複数のチームがそれぞれのデータを管理できるようにするには、Analytics Hub を使用するのが最適です。オプション C が最適な選択肢である理由は次のとおりです。
分析ハブ:
Analytics Hub を使用すると、チームはデータをデータ交換として公開できるため、他のチームが必要なデータを簡単に検出してサブスクライブできるようになります。
このアプローチにより、各チームのデータに対する制御を維持しながら、組織全体で簡単かつ安全なデータ共有を促進します。
データの公開と購読:
チームは管理するデータセットを公開できるため、アクセスと更新を個別に管理できます。
他のチームはこれらの公開されたデータセットをサブスクライブできるため、作業を重複させることなく最新のデータにアクセスできます。
運用タスクとコストの最小化:
この方法により、複雑なレプリケーションやデータ同期プロセスの必要性が減り、運用オーバーヘッドが最小限に抑えられます。
Analytics Hub を通じてデータ共有を一元化することで、大規模なデータセットの複製に関連するストレージコストも削減されます。
実装手順:
分析ハブを設定する:
Google Cloud プロジェクトで Analytics Hub を有効にします。
データ交換を公開およびサブスクライブする方法についてチームにトレーニングを提供します。
データを公開:
各チームは、必要に応じてアクセス制御とメタデータを構成し、Analytics Hub でデータセットを公開します。
データを購読する:
他のチームのデータにアクセスする必要があるチームは、関連するデータ交換にサブスクライブして、常に最新のデータを確保できます。
参照：
アナリティクスハブのドキュメント
Analytics Hubでデータを公開する
Analytics Hub でデータを購読する

他のバージョン: 550Google.Professional-Data-Engineer.v2026-05-11.q113; 2290Google.Professional-Data-Engineer.v2025-01-13.q310; 2323Google.Professional-Data-Engineer.v2024-06-07.q281; 1860Google.Professional-Data-Engineer.v2023-09-15.q214; 2264Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 147Salesforce.Mule-Arch-201.v2026-06-13.q56; 132Fortinet.NSE7_SOC_AR-7.6.v2026-06-13.q26; 140HP.HPE0-G04.v2026-06-13.q33; 162CrowdStrike.CCFA-200b.v2026-06-13.q88; 165Salesforce.Mule-Dev-201.v2026-06-12.q88; 179WGU.Information-Technology-Management.v2026-06-12.q113; 296CuramSoftware.CS0-003.v2026-06-12.q520; 203Salesforce.NP-Con-101.v2026-06-11.q92; 191RealEstate.Maryland-Real-Estate-Salesperson.v2026-06-11.q107; 249Microsoft.AZ-204.v2026-06-11.q260

Professional-Data-Engineer 試験問題 246

Professional-Data-Engineer 試験問題 247

Professional-Data-Engineer 試験問題 248

Professional-Data-Engineer 試験問題 249

Professional-Data-Engineer 試験問題 250

PDFファイルをダウンロード