[2024-06-17更新,112問] 無料Google Professional-Machine-Learning-Engineer試験問題集、Professional-Machine-Learning-Engineer問題集(ページ 17)

Professional-Machine-Learning-Engineer 試験問題 76

あなたは、最近 ML とデータのワークロードを Google Cloud に移行することを決定した大規模な組織で働いています。データエンジニアリングチームは、構造化データを Avro 形式で Cloud Storage バケットにエクスポートしました。分析を実行し、機能を作成し、ML モデルがオンライン予測に使用する機能をホストするワークフローを提案する必要があります。パイプラインはどのように構成すればよいでしょうか?

A. Avro ファイルを BigQuery に取り込んで分析を実行します。Dataflow パイプラインを使用して特徴を作成し、オンライン予測のために Vertex Al Feature Store に保存します。

B. Avro ファイルを Cloud Spanner に取り込んで分析を実行します。Dataflow パイプラインを使用して機能を作成します。オンライン予測のために Vertex Al Feature Store に保存します。

C. Avro ファイルを BigQuery に取り込んで分析を実行します。BigQuery SQL を使用して特徴を作成し、オンライン予測用に別の BigQuery テーブルに保存します。

D. Avro ファイルを Cloud Spanner に取り込んで分析を実行します。Dataflow パイプラインを使用して特徴を作成し、オンライン予測のために BigQuery に保存します。

Professional-Machine-Learning-Engineer 試験問題 77

データサイエンスチームは、スケジュールされたモデルの再トレーニングをサポートするシステム、Docker コンテナー、およびオンライン予測リクエストの自動スケーリングと監視をサポートするサービスをリクエストしました。このシステムにはどのプラットフォームコンポーネントを選択する必要がありますか?

A. Vertex AI パイプラインと Al プラットフォーム予測

B. Cloud Composer、BigQuery ML、および Al プラットフォームの予測

C. Cloud Composer、カスタムコンテナを使用した Al Platform Training、App Engine

D. Vertex AI パイプラインと App Engine

Professional-Machine-Learning-Engineer 試験問題 78

カテゴリカル入力変数を含むデータセットを使用して ML モデルを開発しています。データの半分をトレーニングセットとテストセットにランダムに分割しました。トレーニングセット内のカテゴリ変数にワンホットエンコーディングを適用した後、テストセットから 1 つのカテゴリ変数が欠落していることがわかりました。あなたは何をするべきか？

A. トレーニングセットに 70%、テストセットに 30% を使用して、データをランダムに再配布します。

B. テストセットでスパース表現を使用します

C. テストデータ内のカテゴリ変数にワンホットエンコーディングを適用します。

D. すべてのカテゴリを表すさらに多くのデータを収集します

正解: C

テストセット内の欠落しているカテゴリ変数に対処するための最良のオプションは、テストデータ内のカテゴリ変数にワンホットエンコーディングを適用することです。このオプションには次の利点があります。
* ワンホットエンコーディングはカテゴリ変数をモデルで簡単に処理できるバイナリベクトルに変換するため、ML モデルのデータ形式の一貫性と互換性が保証されます。テストデータ内のカテゴリ変数にワンホットエンコーディングを適用すると、テストデータ内の特徴の数と順序をトレーニングデータと一致させ、モデル予測におけるエラーや不一致を回避できます。
* ワンホットエンコーディングはカテゴリ変数の考えられる値ごとに個別の特徴を作成し、実際の値に対応する特徴に値 1 を割り当てるため、ML モデルのデータの情報と関連性が保持されます。変数、残りは 0。テストデータ内のカテゴリ変数にワンホットエンコーディングを適用すると、カテゴリ変数の元の意味と重要性を保持し、データの損失や歪みを回避できます。
他のオプションは、次の理由からあまり最適ではありません。
* オプション A: データをトレーニングセットに 70%、テストセットに 30% としてランダムに再配布すると、さらなる複雑さとリスクが生じます。このオプションでは、データを再度シャッフルして分割する必要があり、面倒で時間がかかる可能性があります。さらに、このオプションは、データ分布のランダム性に依存するため、欠落しているカテゴリ変数がテストセットに存在することを保証しない場合があります。さらに、このオプションは、モデルが元のトレーニングセットから学習したデータの特性やパターンを変更する可能性があるため、ML モデルの品質と有効性に影響を与える可能性があります。
* オプション B: テストセットでスパース表現を使用すると、追加のオーバーヘッドと非効率が生じます。
* このオプションでは、テストセット内のカテゴリ変数をスパースベクトルに変換する必要があります。スパースベクトルとは、ほとんどの値がゼロであり、ゼロ以外の要素のインデックスと値のみを格納するベクトルです。
ただし、モデルでは入力データがトレーニングデータと同じ形式と次元を持つことを想定しており、ワンホットエンコーディングを使用するため、テストセットでのスパース表現の使用は ML モデルと互換性がない可能性があります。さらに、テストセットでスパース表現を使用すると、スパースベクトルを保存および処理するために追加の計算とメモリが必要になるため、効率的またはスケーラブルではない可能性があります。
* オプション D: すべてのカテゴリを表すより多くのデータを収集すると、追加のコストと遅延が発生します。このオプションでは、欠落しているカテゴリ変数を含むさらに多くのデータを取得してラベルを付ける必要があり、コストと時間がかかる可能性があります。さらに、データソースやビジネス上の問題によっては、欠落しているカテゴリ変数が利用できないか、テストデータに関連しない可能性があるため、このオプションは実行不可能または必要でない場合があります。

Professional-Machine-Learning-Engineer 試験問題 79

あなたは小売会社に勤めています。Vertex Al には、3 つの異なる店舗からの売上データを含む管理された表形式データセットがあります。データセットには、店舗名や販売タイムスタンプなどのいくつかの特徴が含まれています。そのデータを使用して、間もなくオープンする新しい店舗の売上予測を行うモデルをトレーニングしたいと考えています。トレーニング、検証、およびテストセットの間でデータを分割する必要があります。データを分割するにはどのようなアプローチを使用する必要がありますか?

A. Vertex Al 手動分割を使用し、ストア名機能を使用して各セットに 1 つのストアを割り当てます。

B. Vertex Al のデフォルトのデータ分割を使用します。

C. Vertex Al 時系列分割を使用し、販売タイムスタンプ機能をタイムバナブルとして指定します。

D. Vertex Al ランダム分割を使用して、行の 70% をトレーニングセットに割り当て、10% を検証セットに割り当てます。
テストセットの 20%。

正解: B

3 つの異なる店舗からの売上データを含む Vertex AI の管理された表形式データセットを使用して、トレーニング、検証、テストセット間でデータを分割するための最良のオプションは、Vertex AI のデフォルトデータ分割を使用することです。
このオプションを使用すると、Vertex AI のパワーとシンプルさを活用して、データをパーセンテージで 3 つのセットに自動的かつランダムに分割できます。Vertex AI は、Google Cloud 上で機械学習ソリューションを構築およびデプロイするための統合プラットフォームです。Vertex AI は、線形回帰、ロジスティック回帰、K 平均法クラスタリング、行列因数分解、ディープニューラルネットワークなど、さまざまなタイプのモデルをサポートできます。Vertex AI は、データ分析、モデル開発、モデル展開、モデル監視、モデルガバナンスのためのさまざまなツールとサービスも提供できます。デフォルトのデータ分割は、Vertex AI によって提供されるデータ分割方法であり、ユーザーの入力や構成は必要ありません。デフォルトのデータ分割は、ランダムサンプリング方法を使用してデータをトレーニング、検証、テストセットに分割し、データの固定パーセンテージを各セットに割り当てるのに役立ちます。デフォルトのデータ分割はデータ分割プロセスを簡素化するのに役立ち、ほとんどの場合にうまく機能します。
トレーニングセットは、モデルをトレーニングし、モデルパラメーターを調整するために使用されるデータのサブセットです。トレーニングセットは、入力特徴とターゲット変数の間の関係を学習し、モデルのパフォーマンスを最適化するのに役立ちます。検証セットは、モデルを検証し、モデルのハイパーパラメーターを調整するために使用されるデータのサブセットです。検証セットは、目に見えないデータに対するモデルのパフォーマンスを評価し、過剰適合または過小適合を回避するのに役立ちます。テストセットは、モデルのテストに使用されるデータのサブセットであり、最終的な評価指標を提供します。テストセットは、新しいデータに対するモデルのパフォーマンスを評価し、モデルの汎化能力を測定するのに役立ちます。Vertex AI のデフォルトデータ分割を使用すると、ランダムサンプリング方法を使用してデータをトレーニング、検証、テストセットに分割し、次の割合のデータを各セットに割り当てることができます1。

他のオプションは、次の理由により、オプション B ほど優れていません。
* オプション A: Vertex AI 手動分割を使用し、ストア名機能を使用して各セットに 1 つのストアを割り当てると、データを代表的なバランスのとれたセットに分割できず、エラーやパフォーマンスの低下が発生する可能性があります。手動分割は、ml_use ラベルまたはデータフィルター式を使用して、データをセットに分割する方法を制御できるデータ分割方法です。手動分割は、データ分割ロジックをカスタマイズし、複雑なデータ形式または非標準のデータ形式を処理するのに役立ちます。店名特徴量は、売上データを収集した店舗の名前を示す特徴量です。店舗名機能は、データのソースを特定し、店舗ごとにデータをグループ化するのに役立ちます。ただし、Vertex AI の手動分割を使用し、ストア名機能を使用して各セットに 1 つのストアを割り当てると、データを代表的なバランスの取れたセットに分割できず、エラーやパフォーマンスの低下が発生する可能性があります。書く必要があります
* コードを作成し、ml_use ラベルまたはデータフィルター式を作成して構成し、セットごとに 1 つのストアを割り当てます。さらに、このオプションでは、各セットのデータがデータセット全体のデータと同じ分布と特性を持つことが保証されないため、データの一般的なパターンを学習できなくなり、モデルに偏りや分散が生じる可能性があります2。
* オプション C: Vertex AI 時系列分割を使用し、販売タイムスタンプ機能を時間変数として指定すると、データを代表的なバランスのとれたセットに分割できず、エラーやパフォーマンスの低下が発生する可能性があります。時系列分割は、データの順序に基づいてデータをセットに分割できるデータ分割方法です。時系列に分割すると、データの時間的な依存関係と順序を保持し、データ漏洩を防ぐことができます。販売タイムスタンプ機能は、販売データが収集された日時を示す機能です。販売タイムスタンプ機能は、時間の経過に伴うデータの変化と傾向を追跡し、データの季節性と周期性を把握するのに役立ちます。ただし、Vertex AI 時系列分割を使用し、販売タイムスタンプ機能を時間変数として指定すると、データを代表的なバランスのとれたセットに分割できず、エラーやパフォーマンスの低下が発生する可能性があります。コードを記述し、時間変数を作成して構成し、時間変数の順序でデータを分割する必要があります。さらに、このオプションでは、各セットのデータがデータセット全体のデータと同じ分布と特性を持つことが保証されないため、データの一般的なパターンを学習できなくなり、モデルに偏りや分散が生じる可能性があります3。
* Option D: Using Vertex AI random split, assigning 70% of the rows to the training set, 10% to the validation set, and 20% to the test set would not allow you to use the default data splitmethod that is provided by Vertex AI, and could increase the complexity and cost of the data split process. A random split is a data split method that allows you to split your data into sets by using a random sampling method, and assign a custom percentage of the data to each set. A random split can help you split your data into representative and balanced sets, and avoid data leakage. However, using Vertex AI random split, assigning 70% of the rows to the training set, 10% to the validation set, and 20% to the test set would not allow you to use the default data split method that is provided by Vertex AI, and could increase the complexity and cost of the data split process. You would need to write code, create and configure the random split method, and assign the custom percentages to each set. Moreover, this option would not use the default data split method that is provided by Vertex AI, which can simplify the data split process, and works well in most cases1.
References:
* About data splits for AutoML models | Vertex AI | Google Cloud
* Manual split for unstructured data
* Mathematical split

Professional-Machine-Learning-Engineer 試験問題 80

Google Cloud でディープニューラルネットワークモデルをトレーニングしました。モデルはトレーニングデータでは損失が少ないですが、検証データではパフォーマンスが悪くなります。モデルには過学習に対する耐性を持たせる必要があります。モデルを再トレーニングするときにどの戦略を使用する必要がありますか?

A. Al プラットフォームでハイパーパラメータ調整ジョブを実行して、L2 正則化パラメータとドロップアウトパラメータを最適化します。

B. Al プラットフォームでハイパーパラメータ調整ジョブを実行して学習率を最適化し、ニューロンの数を 2 倍に増やします。

C. 12 の正則化パラメータ 0.4 を適用し、学習率を 10 分の 1 に下げます。

D. ドロップアウトパラメータ 0 2 を適用し、学習率を 10 分の 1 に減少させます。

Professional-Machine-Learning-Engineer プレミアム問題集

365日無料更新
専門家プレゼンツ
300 問題と解答
Windows / Mac / Android / iOS　などをサポート

最新 Google Professional-Machine-Learning-Engineer 試験問題集は GoShiken.com のサポートで Professional-Machine-Learning-Engineer 試験を合格させます！

(40%OFF 特別割引: JPNPDF)

今すぐダウンロード

他のバージョン: 1569Google.Professional-Machine-Learning-Engineer.v2025-04-14.q216; 1099Google.Professional-Machine-Learning-Engineer.v2023-10-04.q116; 1086Google.Professional-Machine-Learning-Engineer.v2022-12-19.q66

最新アップロード: 105Oracle.1z0-1057-25.v2026-06-04.q45; 105Amazon.AWS-Certified-Developer-Associate.v2026-06-04.q323; 106Fortinet.FCSS_SDW_AR-7.4.v2026-06-04.q76; 131SAP.C_THR88_2505.v2026-06-03.q76; 149WGU.Web-Development-Applications.v2026-06-03.q73; 134Salesforce.Mule-Dev-301.v2026-06-02.q22; 181CISI.IFC.v2026-06-02.q111; 194Huawei.H13-611_V5.0.v2026-06-01.q113; 226Cisco.200-201.v2026-06-01.q230; 184Huawei.H35-211_V2.5.v2026-06-01.q109