[2024-06-07更新,281問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer試験情報(ページ 19)

Professional-Data-Engineer 試験問題 86

あなたは、衣服を推奨するためのモデルを構築しています。ユーザーのファッションは時間の経過とともに変化する可能性が高いことがわかっているため、新しいデータが利用可能になったときにモデルにストリーミングして戻すデータパイプラインを構築します。モデルをトレーニングするためにこのデータをどのように使用する必要がありますか?

A. 新しいデータのみでモデルを継続的に再トレーニングします。

B. 既存のデータと新しいデータの組み合わせに基づいてモデルを継続的に再トレーニングします。

C. 新しいデータをテストセットとして使用しながら、既存のデータでトレーニングします。

D. 既存のデータをテストセットとして使用しながら、新しいデータでトレーニングします。

Professional-Data-Engineer 試験問題 87

あなたは大規模な不動産会社に勤めており、機械学習に使用するために 6 TB の住宅販売データを準備しています。SOL を使用してデータを変換し、BigQuery ML を使用して機械学習モデルを作成します。
変換されていない生のデータセットに対する予測にモデルを使用する予定です。予測時のスキューを防ぐためにワークフローをどのように設定すればよいでしょうか?

A. モデルを作成するときは、BigQuery の TRANSFORM 句を使用して前処理の停止を定義します。予測時には、生の入力データに対する変換を指定せずに、BigQuery の ML.EVALUATE 句を使用します。

B. モデルを作成するときは、BigQuery の TRANSFORM 句を使用して前処理ステップを定義します。予測をリクエストする前に、保存されたクエリを使用して生の入力データを変換し、その後 ML を使用します。
評価する

C. BigOuery を使用して前処理ロジックを定義します。モデルを作成するときは、ビューをモデルトレーニングデータとして使用します。予測時には、生の入力データに対する変換を指定せずに、BigQuery の ML EVALUATE 句を使用します。

D. Dataflow を使用してすべてのデータを前処理します。予測時には、入力データにそれ以上の変換を指定せずに、BigOuery の ML.EVALUATE 句を使用します。

Professional-Data-Engineer 試験問題 88

タイムスタンプ列と ID 列の WHERE 句を使用して BigQuery テーブルをフィルタリングするクエリがあります。bq query -dry_run を使用すると、タイムスタンプと ID のフィルターがデータ全体のごく一部を選択しているにもかかわらず、クエリによってテーブルのフルスキャンがトリガーされることがわかります。既存の SQL クエリへの変更を最小限に抑え、BigQuery によってスキャンされるデータの量を削減したいと考えています。あなたは何をするべきか？

A. ID ごとに個別のテーブルを作成します。

B. LIMIT キーワードを使用して、返される行数を減らします。

C. パーティショニング列とクラスタリング列を含むテーブルを再作成します。

D. bq query - -maximum_bytes_billed フラグを使用して、請求されるバイト数を制限します。

Professional-Data-Engineer 試験問題 89

フローロジスティックのケーススタディ
会社概要
Flowlogistic は、物流およびサプライチェーンの大手プロバイダーです。これらは、世界中の企業がリソースを管理し、最終目的地に輸送するのに役立ちます。同社は急速に成長し、そのサービスを鉄道、トラック、航空機、海洋輸送にまで拡大しました。
会社背景
同社は地域のトラック運送会社としてスタートし、その後他の物流市場にも拡大しました。インフラストラクチャを更新していないため、注文と出荷の管理と追跡がボトルネックになっています。業務を改善するために、Flowlogistic は荷物レベルでリアルタイムに出荷を追跡する独自のテクノロジーを開発しました。ただし、Apache Kafka に基づくテクノロジースタックが処理量をサポートできないため、これをデプロイすることはできません。さらに、Flowlogistic は注文と出荷をさらに分析して、リソースを最適に配置する方法を決定したいと考えています。
ソリューションコンセプト
Flowlogistic は、クラウドを使用して 2 つのコンセプトを実装したいと考えています。
* 独自のテクノロジーをリアルタイム在庫追跡システムに使用し、荷物の位置を示します
* 構造化データと非構造化データの両方を含むすべての注文と出荷ログの分析を実行し、リソースを展開する最適な方法と情報を拡大する市場を決定します。また、予測分析を使用して、出荷がいつ遅れるかを早期に把握したいと考えています。
既存の技術環境
フローロジスティックアーキテクチャは単一のデータセンターに存在します。
* データベース
* 2 つのクラスターに 8 台の物理サーバー
* SQL Server - ユーザーデータ、インベントリ、静的データ
* 物理サーバー 3 台
* Cassandra - メタデータ、メッセージの追跡
10 台の Kafka サーバー - メッセージの集約とバッチ挿入の追跡
* アプリケーションサーバー - 顧客フロントエンド、注文/カスタム用ミドルウェア
* 20 台の物理サーバーにわたる 60 台の仮想マシン
* Tomcat - Java サービス
* Nginx - 静的コンテンツ
* バッチサーバー
ストレージアプライアンス
* 仮想マシン (VM) ホスト用の iSCSI
* ファイバーチャネルストレージエリアネットワーク (FC SAN) - SQL サーバーストレージ
* ネットワーク接続ストレージ (NAS) イメージストレージ、ログ、バックアップ
* 10 台の Apache Hadoop /Spark サーバー
* コアデータレイク
* データ分析ワークロード
* 20 のさまざまなサーバー
* Jenkins、モニタリング、要塞ホスト、
ビジネス要件
* スケールされた本番環境を使用して、信頼性が高く再現可能な環境を構築します。
* 分析のために一元化されたデータレイクにデータを集約します
* 履歴データを使用して、将来の出荷に関する予測分析を実行します
* 独自のテクノロジーを使用して世界中のすべての出荷を正確に追跡します
* 新しいリソースの迅速なプロビジョニングにより、ビジネスの機敏性とイノベーションの速度を向上させます。
* クラウドでのパフォーマンスのためにアーキテクチャを分析して最適化する
* 他のすべての要件が満たされている場合は、クラウドに完全に移行します。
技術的要件
* ストリーミングデータとバッチデータの両方を処理します
* 既存の Hadoop ワークロードを移行する
* 企業の変化する要求に対応できるように、アーキテクチャが拡張性と弾力性を備えていることを確認します。
* 可能な限りマネージドサービスを使用する
* データフライトと保存時の暗号化
* 本番データセンターとクラウド環境の間に VPN を接続する SEO ステートメント当社は急速に成長してきたため、インフラストラクチャをアップグレードできないことが、さらなる成長と効率性を実際に妨げています。当社は世界中で荷物を効率的に移動させますが、データを移動させるのは非効率的です。
顧客がどこにいるのか、何を出荷しているのかをより簡単に理解できるように、情報を整理する必要があります。
CTO ステートメント
当社にとって IT はこれまで決して優先事項ではなかったので、データが増大する一方でテクノロジーへの投資が十分ではありませんでした。IT を管理する優秀なスタッフがいますが、彼らはインフラストラクチャの管理で忙しいため、データの整理、分析の構築、CFO の実装方法の検討など、本当に重要なことを彼らにやってもらうことができません。追跡技術。
CFO ステートメント
当社の競争上の優位性の 1 つは、出荷と配達の遅延に対してペナルティを課していることです。出荷品がどこにあるかを常に把握することは、当社の収益と収益性と直接的な相関関係があります。さらに、サーバー環境の構築に資金を投入したくありません。
Flowlogistic は、リアルタイム在庫追跡システムを展開しています。すべての追跡デバイスはパッケージ追跡メッセージを送信し、Apache Kafka クラスターではなく単一の Google Cloud Pub/Sub トピックに送信されるようになります。その後、サブスクライバーアプリケーションがリアルタイムレポート用にメッセージを処理し、履歴分析のために Google BigQuery に保存します。パッケージデータを長期にわたって確実に分析できるようにしたいと考えています。
どのアプローチを取るべきですか?

A. Cloud Pub/Sub サブスクライバアプリケーションの各メッセージを受信したときにタイムスタンプを添付します。

B. Cloud Pub/Sub から自動的に生成されたタイムスタンプを使用してデータを並べ替えます。

C. Clod Pub/Sub に送信されるときに、各パブリッシャーデバイスからの送信メッセージにタイムスタンプとパッケージ ID を添付します。

D. BigQuery の NOW () 関数を使用して、イベントの時刻を記録します。

Professional-Data-Engineer 試験問題 90

Cloud Bigtable は、非常に大量のデータを保存する場合に推奨されるオプションです。
____________________________?

A. レイテンシが非常に高いマルチキーデータ

B. レイテンシが非常に低いマルチキーデータ

C. 遅延が非常に短い単一キーのデータ

D. レイテンシが非常に高い単一キーのデータ

他のバージョン: 483Google.Professional-Data-Engineer.v2026-05-11.q113; 815Google.Professional-Data-Engineer.v2025-12-29.q327; 2222Google.Professional-Data-Engineer.v2025-01-13.q310; 1807Google.Professional-Data-Engineer.v2023-09-15.q214; 2248Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 108Oracle.1z0-1057-25.v2026-06-04.q45; 107Fortinet.FCSS_SDW_AR-7.4.v2026-06-04.q76; 134SAP.C_THR88_2505.v2026-06-03.q76; 151WGU.Web-Development-Applications.v2026-06-03.q73; 135Salesforce.Mule-Dev-301.v2026-06-02.q22; 184CISI.IFC.v2026-06-02.q111; 196Huawei.H13-611_V5.0.v2026-06-01.q113; 230Cisco.200-201.v2026-06-01.q230; 197Huawei.H35-211_V2.5.v2026-06-01.q109; 141Salesforce.Analytics-Admn-201.v2026-06-01.q20

Professional-Data-Engineer 試験問題 86

Professional-Data-Engineer 試験問題 87

Professional-Data-Engineer 試験問題 88

Professional-Data-Engineer 試験問題 89

Professional-Data-Engineer 試験問題 90

PDFファイルをダウンロード