[2024-06-07更新,281問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer試験情報(ページ 30)

Professional-Data-Engineer 試験問題 141

BigQuery テーブルに 100 GB のデータが保存されています。このデータは古いため、SQL による分析のために年に 1 ～ 2 回しかアクセスされません。バックアップの目的で、このデータを不変に保存したいと考えています。
3年。ストレージコストを最小限に抑えたい。あなたは何をするべきか？

A. 1 BigQuery テーブルのクローンを作成します。
2. 分析を実行する必要がある場合は、クローンをクエリします。

B. 1 BigQuery テーブルのスナップショットを作成します。
2 分析を実行する必要がある場合は、スナップショットを復元します。

C. 1. アーカイブストレージクラスを使用して、Cloud Storage バケットへの BigQuery エクスポートを実行します。
2 バケットで versionmg を有効にします。
3. エクスポートされたファイルに BigQuery 外部テーブルを作成します。

D. 1 アーカイブストレージクラスを使用して、Cloud Storage バケットへの BigQuery エクスポートを実行します。
2 バケットにロックされた保持ポリシーを設定します。
3. エクスポートされたファイルに BigQuery 外部テーブルを作成します。

正解: D

このオプションを使用すると、アーカイブストレージクラスの GB あたりの価格がクラウドストレージクラスの中で最も低いため、低コストのストレージオプションにデータを保存できます。また、ロックされた保持ポリシーにより、保持期間が終了するまでデータの削除や上書きが防止されるため、データは 3 年間不変であることが保証されます。Cloud Storage バケット内のエクスポートされたファイルを参照する BigQuery 外部テーブルを作成することで、SQL を使用してデータをクエリすることができます。選択肢 A は不正解です。BigQuery テーブルのクローンを作成しても、クローンのサイズとストレージクラスは元のテーブルと同じになるため、ストレージコストは削減されません。オプション B は不正解です。スナップショットのサイズとストレージクラスは元のテーブルと同じになるため、BigQuery テーブルのスナップショットを作成してもストレージコストは削減されません。オプション C は不正解です。適切な権限を持つユーザーなら誰でもバージョンを削除したり上書きしたりできるため、バケットでバージョニングを有効にしてもデータは不変にはなりません。また、ファイルの各バージョンが個別に請求されるため、ストレージコストも増加します。参考文献:
* テーブルデータのエクスポート | ビッグクエリ | グーグルクラウド
* ストレージクラス | クラウドストレージ | グーグルクラウド
* 保存ポリシーと保存期間 | クラウドストレージ | グーグルクラウド
* フェデレーテッドクエリ | ビッグクエリ | グーグルクラウド

Professional-Data-Engineer 試験問題 142

MJTelco の導入事例
会社概要
MJTelco は、急速に成長している世界中の十分なサービスが提供されていない市場にネットワークを構築することを計画している新興企業です。同社は革新的な光通信ハードウェアに関する特許を取得しています。これらの特許に基づいて、安価なハードウェアを使用して信頼性の高い高速バックボーンリンクを多数作成できます。
会社背景
経験豊富な通信会社幹部によって設立された MJTelco は、もともと宇宙での通信の課題を克服するために開発されたテクノロジーを使用しています。運用の基礎として、リアルタイム分析を推進し、機械学習を組み込んでトポロジを継続的に最適化する分散データインフラストラクチャを作成する必要があります。同社のハードウェアは安価であるため、場所の可用性とコストに対する動的な地域政治の影響を考慮して、ネットワークを過剰に展開することを計画しています。
同社の管理および運用チームは世界中に配置されており、システム内のデータ利用者と提供の間に多対多の関係を構築しています。慎重に検討した結果、パブリッククラウドがニーズをサポートするのに最適な環境であると判断しました。
ソリューションコンセプト
MJTelco は、自社の研究所で概念実証 (PoC) プロジェクトを成功させています。彼らには 2 つの主要なニーズがあります。
PoC を拡張して強化し、より多くのデータフローが生成されたときに生成される大幅に多くのデータフローをサポートします。

インストール数は 50,000 を超えています。
機械学習サイクルを改良して、制御に使用する動的モデルを検証および改善する

トポロジ定義。
MJTelco は、開発/テスト、ステージング、実稼働という 3 つの異なるオペレーティング環境も使用します。
- 実験の実行、新機能の導入、運用顧客へのサービスのニーズを満たすため。
ビジネス要件
最小限のコストで運用環境をスケールアップし、いつでもどこでもリソースをインスタンス化します

予測不可能な分散型通信ユーザーコミュニティでは必要とされます。
独自のデータのセキュリティを確保して、最先端の機械学習と分析を保護します。

分散した研究員が分析用データに確実かつタイムリーにアクセスできるようにする

機械学習モデルの迅速な反復をサポートする隔離された環境を維持します。

顧客に影響を与えます。
技術的要件
テレメトリデータの安全かつ効率的な転送と保存を確保します。

インスタンスを迅速に拡張して、複数のフローで 10,000 ～ 100,000 のデータプロバイダーをサポートします

それぞれ。
約 2 年間保存されているデータを追跡するデータテーブルに対する分析とプレゼンテーションが可能

100m記録/日
データパイプラインの問題の認識に重点を置いたモニタリングインフラストラクチャの迅速な反復をサポートします。

テレメトリフローと本番環境の学習サイクルの両方で。
CEOの声明
当社のビジネスモデルは、特許、分析、動的機械学習に依存しています。当社の安価なハードウェアは信頼性が高くなるように構成されているため、コスト面でのメリットが得られます。信頼性と容量の約束を満たすために、大規模な分散データパイプラインを迅速に安定させる必要があります。
CTO ステートメント
当社のパブリッククラウドサービスは、宣伝どおりに動作する必要があります。データを拡張し、安全に保つためのリソースが必要です。データサイエンティストがモデルを注意深く研究し、迅速に適応できる環境も必要です。私たちは自動化に依存してデータを処理しているため、反復中に機能する開発環境とテスト環境も必要です。
CFO ステートメント
プロジェクトが大きすぎるため、データと分析に必要なハードウェアとソフトウェアを維持できません。
また、非常に多くのデータフィードを監視するための運用チームに人員を配置する余裕はないため、自動化とインフラストラクチャに依存することになります。Google Cloud の機械学習により、定量的研究者はデータパイプラインの問題ではなく、価値の高い問題に取り組むことができるようになります。
Google データポータル 360 で大規模なチーム用の新しいレポートを作成します。このレポートは、データソースとして Google BigQuery を使用します。従業員が自分の地域に関連付けられたデータのみを表示できるようにすることが会社のポリシーであるため、地域ごとにテーブルを作成してデータを入力します。データへの地域アクセスポリシーを適用する必要があります。
どの 2 つのアクションを取る必要がありますか? (2つお選びください。)

A. すべてのテーブルがグローバルデータセットに含まれていることを確認します。

B. 各ビューの設定を調整して、関連するリージョンベースのセキュリティグループのビューアクセスを許可します。

C. 各テーブルの設定を調整して、関連するリージョンベースのセキュリティグループの表示アクセスを許可します。

D. 各データセットの設定を調整して、関連するリージョンベースのセキュリティグループの表示アクセスを許可します。

E. 各テーブルがリージョンのデータセットに含まれていることを確認します。

Professional-Data-Engineer 試験問題 143

BigQuery のキャッシュに関する次の記述のうち、正しいものはどれですか?

A. デフォルトでは、クエリの結果はキャッシュされません。

B. BigQuery はクエリ結果を 48 時間キャッシュします。

C. 宛先テーブルを指定した場合でも、クエリ結果はキャッシュされます。

D. キャッシュから結果を取得するクエリには料金はかかりません。

Professional-Data-Engineer 試験問題 144

Apache Hadoop クラスター上で実行するように会社の ETL パイプラインを作成する責任はあなたにあります。パイプラインには、いくつかのチェックポイント設定とパイプラインの分割が必要です。パイプラインを作成するにはどの方法を使用する必要がありますか?

A. MapReduce を使用した Python

B. Pig を使用した PigLatin

C. Hive を使用した HiveQL

D. MapReduce を使用した Java

Professional-Data-Engineer 試験問題 145

バッチ予測ではなくオンライン予測を使用する 2 つの特徴は何ですか?

A. ジョブ内の大量のデータインスタンスを処理し、より複雑なモデルを実行するように最適化されています。

B. 予測は応答メッセージで返されます。

C. 予測は、指定した Cloud Storage の場所にある出力ファイルに書き込まれます。

D. 予測を提供する待ち時間を最小限に抑えるように最適化されています。

他のバージョン: 541Google.Professional-Data-Engineer.v2026-05-11.q113; 869Google.Professional-Data-Engineer.v2025-12-29.q327; 2271Google.Professional-Data-Engineer.v2025-01-13.q310; 1843Google.Professional-Data-Engineer.v2023-09-15.q214; 2259Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 143Salesforce.Mule-Arch-201.v2026-06-13.q56; 131Fortinet.NSE7_SOC_AR-7.6.v2026-06-13.q26; 132HP.HPE0-G04.v2026-06-13.q33; 148CrowdStrike.CCFA-200b.v2026-06-13.q88; 162Salesforce.Mule-Dev-201.v2026-06-12.q88; 172WGU.Information-Technology-Management.v2026-06-12.q113; 273CuramSoftware.CS0-003.v2026-06-12.q520; 185Salesforce.NP-Con-101.v2026-06-11.q92; 190RealEstate.Maryland-Real-Estate-Salesperson.v2026-06-11.q107; 241Microsoft.AZ-204.v2026-06-11.q260

Professional-Data-Engineer 試験問題 141

Professional-Data-Engineer 試験問題 142

Professional-Data-Engineer 試験問題 143

Professional-Data-Engineer 試験問題 144

Professional-Data-Engineer 試験問題 145

PDFファイルをダウンロード