[2025-01-13更新,310問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer日本語関連対策(ページ 53)

Professional-Data-Engineer 試験問題 256

MJTelco のケーススタディ
会社概要
MJTelco は、世界中で急速に成長しているがサービスが行き届いていない市場にネットワークを構築することを計画しているスタートアップ企業です。
同社は革新的な光通信ハードウェアの特許を保有しており、これらの特許に基づいて、安価なハードウェアで信頼性の高い高速バックボーンリンクを多数構築できます。
会社概要
経験豊富な通信会社の幹部によって設立された MJTelco は、宇宙での通信の課題を克服するために開発されたテクノロジーを使用しています。同社の業務の基盤となるのは、リアルタイム分析を推進し、機械学習を組み込んでトポロジを継続的に最適化する分散データインフラストラクチャを作成することです。ハードウェアは安価であるため、同社はネットワークを過剰に展開して、地域政治の変動が場所の可用性とコストに与える影響を考慮に入れることを計画しています。
同社の管理および運用チームは世界中に配置されており、システム内のデータコンシューマーとデータ提供者の間に多対多の関係を構築しています。慎重に検討した結果、パブリッククラウドがニーズをサポートするのに最適な環境であると判断しました。
ソリューションコンセプト
MJTelco は、自社のラボで概念実証 (PoC) プロジェクトを成功させています。同社には主に 2 つのニーズがあります。
* インストール数が 50,000 を超える場合に生成されるデータフローを大幅に増やせるように、PoC を拡張および強化します。
* 機械学習サイクルを改良して、トポロジ定義を制御するために使用する動的モデルを検証および改善します。
MJTelco は、実験の実行、新機能の導入、実稼働顧客へのサービス提供のニーズを満たすために、開発/テスト、ステージング、実稼働の 3 つの個別の運用環境も使用します。
ビジネス要件
* 予測不可能な分散型通信ユーザーコミュニティで必要なときに必要な場所でリソースをインスタンス化し、最小限のコストで実稼働環境を拡張します。
* 最先端の機械学習と分析を保護するために、独自のデータのセキュリティを確保します。
* 分散した研究員が分析するためのデータに信頼性とタイムリーなアクセスを提供する
* 顧客に影響を与えることなく、機械学習モデルの迅速な反復をサポートする分離された環境を維持します。
技術要件
テレメトリデータの安全かつ効率的な転送と保存を確保する
インスタンスを迅速に拡張して、それぞれ複数のフローを持つ 10,000 ～ 100,000 のデータプロバイダーをサポートします。
1 日あたり約 1 億件のレコードを保存し、最大 2 年間のデータを追跡するデータテーブルに対する分析とプレゼンテーションを可能にします。テレメトリフローと実稼働学習サイクルの両方でのデータパイプラインの問題を認識することに重点を置いた監視インフラストラクチャの迅速な反復をサポートします。
CEOの声明
当社のビジネスモデルは、特許、分析、動的機械学習に依存しています。当社の安価なハードウェアは信頼性が高くなるように構成されており、コスト面で有利です。信頼性と容量のコミットメントを満たすには、大規模な分散データパイプラインを迅速に安定化する必要があります。
CTO 声明
パブリッククラウドサービスは宣伝どおりに動作する必要があります。拡張可能で、データを安全に保つリソースが必要です。
また、データサイエンティストがモデルを慎重に研究し、迅速に適応できる環境も必要です。
データ処理には自動化が不可欠であるため、反復作業中に開発環境とテスト環境も機能させる必要があります。
CFOの声明
プロジェクトが大きすぎるため、データと分析に必要なハードウェアとソフトウェアを維持することはできません。また、多数のデータフィードを監視する運用チームを配置する余裕もないため、自動化とインフラストラクチャに頼ることになります。Google Cloud の機械学習により、定量的研究者はデータパイプラインの問題ではなく、価値の高い問題に取り組むことができます。
MJTelcoでは、Google Bigtableでスキーマを作成し、過去1年間の履歴分析を行う必要があります。
2 年間の記録。受信される各記録は 15 分ごとに送信され、デバイスの一意の識別子とデータレコードが含まれます。最も一般的なクエリは、特定のデバイスに関する特定の日のすべてのデータを取得するものです。どのスキーマを使用すればよいでしょうか。

A. 行キー: date#data_point
列データ: device_id

B. 行キー: data_point
列データ: device_id、date

C. 行キー: 日付
列データ: device_id、data_point

D. 行キー: device_id
列データ: date、data_point

E. 行キー: 日付#デバイスID
列データ: data_point

Professional-Data-Engineer 試験問題 257

ほぼリアルタイムで毎分 10,000 件のメッセージの速度でソーシャルメディアの投稿を Google BigQuery に保存して分析する必要があります。最初に、個々の投稿にストリーミング挿入を使用するようにアプリケーションを設計します。
アプリケーションは、ストリーミング挿入の直後にデータ集計も実行します。ストリーミング挿入後のクエリは強い一貫性を示さず、クエリからのレポートで実行中のデータが欠落する可能性があることがわかりました。アプリケーション設計をどのように調整すればよいでしょうか。

A. 蓄積されたデータを 2 分ごとに読み込むようにアプリケーションを書き直します。

B. ストリーミング挿入コードを個々のメッセージのバッチロードに変換します。

C. 元のメッセージを Google Cloud SQL に読み込み、ストリーミング挿入を介して 1 時間ごとにテーブルを BigQuery にエクスポートします。

D. ストリーミング挿入後のデータ可用性の平均待ち時間を見積もり、常に 2 倍の時間待機してからクエリを実行します。

Professional-Data-Engineer 試験問題 258

あなたのチームは、Google Cloud 上にデータレイクプラットフォームを構築しています。データ基盤設計の一環として、すべての生データを Cloud Storage に保存することを計画しています。1 日に約 25 GB のデータが取り込まれると予想されており、請求部門は古いデータの保存にかかるコストの増加を懸念しています。現在のビジネス要件は次のとおりです。
* 古いデータはいつでも削除できます
* 視覚化レイヤーを現在のレポートと過去のレポートに使用することを計画している
* 古いデータはアクセスするとすぐに利用可能になる
* データの取得には料金はかかりません。
コストを最適化するにはどうすればよいでしょうか?

A. Autoclass ストレージクラス機能を使用してバケットを作成します。

B. オブジェクトライフサイクル管理ポリシーを作成し、30 日以上経過したデータのストレージクラスをニアライン、90 日以上経過したデータのストレージクラスをコールドライン、365 日以上経過したデータのストレージクラスに変更します。必要に応じて古いデータを削除します。

C. オブジェクトライフサイクル管理ポリシーを作成し、30 日以上経過したデータのストレージクラスをコールドライン、90 日以上経過したデータのストレージクラスをニアラインに変更します。365 日以上経過したデータのストレージクラスをアーカイブに変更し、必要に応じて古いデータを削除します。

D. オブジェクトライフサイクル管理ポリシーを作成し、30 日以上経過したデータのストレージクラスを nearlme、45 日以上経過したデータのストレージクラスを coldline、60 日以上経過したデータのストレージクラスに変更します。必要に応じて古いデータを削除します。

Professional-Data-Engineer 試験問題 259

あなたの会社では、バッチベースとストリームベースの両方のイベントデータを受け取ります。予測可能な期間にわたって Google Cloud Dataflow を使用してデータを処理したいと考えています。ただし、場合によってはデータが遅れて到着したり、順序が乱れたりすることがあります。遅れたデータや順序が乱れたデータを処理するために、Cloud Dataflow パイプラインをどのように設計すればよいでしょうか。

A. すべてのデータをキャプチャするための単一のグローバルウィンドウを設定します。

B. 遅延データをすべてキャプチャするためにスライディングウィンドウを設定します。

C. ウォーターマークとタイムスタンプを使用して遅延データをキャプチャします。

D. すべてのデータソースタイプ (ストリームまたはバッチ) にタイムスタンプがあることを確認し、タイムスタンプを使用して遅延データのロジックを定義します。

Professional-Data-Engineer 試験問題 260

BigQuery テーブル内の特定のパーティションをクエリするにはどうすればよいでしょうか?

A. WHERE句でDAY列を使用する

B. EXTRACT(DAY)句を使用する

C. WHERE句で__PARTITIONTIME疑似列を使用する

D. WHERE句でDATE BETWEENを使用する

他のバージョン: 471Google.Professional-Data-Engineer.v2026-05-11.q113; 815Google.Professional-Data-Engineer.v2025-12-29.q327; 2234Google.Professional-Data-Engineer.v2024-06-07.q281; 1796Google.Professional-Data-Engineer.v2023-09-15.q214; 2239Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 103Oracle.1z0-1057-25.v2026-06-04.q45; 104Amazon.AWS-Certified-Developer-Associate.v2026-06-04.q323; 106Fortinet.FCSS_SDW_AR-7.4.v2026-06-04.q76; 131SAP.C_THR88_2505.v2026-06-03.q76; 149WGU.Web-Development-Applications.v2026-06-03.q73; 130Salesforce.Mule-Dev-301.v2026-06-02.q22; 181CISI.IFC.v2026-06-02.q111; 192Huawei.H13-611_V5.0.v2026-06-01.q113; 224Cisco.200-201.v2026-06-01.q230; 184Huawei.H35-211_V2.5.v2026-06-01.q109

Professional-Data-Engineer 試験問題 256

Professional-Data-Engineer 試験問題 257

Professional-Data-Engineer 試験問題 258

Professional-Data-Engineer 試験問題 259

Professional-Data-Engineer 試験問題 260

PDFファイルをダウンロード