[2024-06-17更新,112問] 無料Google Professional-Machine-Learning-Engineer試験問題集、Professional-Machine-Learning-Engineer問題集(ページ 2)

Professional-Machine-Learning-Engineer 試験問題 1

機械学習スペシャリストは、Amazon Athena を使用して Amazon S3 上のデータセットにクエリを実行するプロセスを構築する必要があります。データセットには、プレーンテキストの CSV ファイルとして保存された 800,000 件を超えるレコードが含まれています。各レコードには次の内容が含まれます
200 列で、サイズは約 1.5 MB です。ほとんどのクエリは 5 ～ 10 列のみにまたがります。
機械学習スペシャリストは、クエリの実行時間を最小限に抑えるためにデータセットをどのように変換する必要がありますか?

A. レコードを Apache Parquet 形式に変換します。

B. レコードを JSON 形式に変換します。

C. レコードを GZIP CSV 形式に変換します。

D. レコードを XML 形式に変換します。

Professional-Machine-Learning-Engineer 試験問題 2

You have trained a deep neural network model on Google Cloud. The model has low loss on the training data, but is performing worse on the validation dat a. You want the model to be resilient to overfitting. Which strategy should you use when retraining the model?

A. Apply a dropout parameter of 0 2, and decrease the learning rate by a factor of 10

B. Apply a L2 regularization parameter of 0.4, and decrease the learning rate by a factor of 10.

C. Run a hyperparameter tuning job on Al Platform to optimize for the L2 regularization and dropout parameters

D. Al プラットフォームでハイパーパラメータ調整ジョブを実行して学習率を最適化し、ニューロンの数を 2 倍に増やします。

Professional-Machine-Learning-Engineer 試験問題 3

あなたは、大規模なデータセットを使用して会社のカスタム言語モデルをトレーニングしています。Vertex Al で ReductionServer 戦略を使用する予定です。分散トレーニングジョブのワーカープールを構成する必要があります。
あなたは何をするべきか？

A. 最初の 2 つのワーカープールのマシンが GPU を備え、トレーニングコードが実行されるコンテナーイメージを使用するように構成します。 3 番目のワーカープールが GPU を持つように構成し、リダクションサーバーコンテナーイメージを使用します。

B. 最初の 2 つのワーカープールのマシンが GPU を備え、トレーニングコードが実行されるコンテナーイメージを使用するように構成します。アクセラレータなしで、reductionserver コンテナーイメージを使用するように 3 番目のワーカープールを構成し、帯域幅を優先するマシンタイプを選択します。

C. 最初の 2 つのワーカープールのマシンが TPU を持ち、トレーニングコードが実行されるコンテナーイメージを使用するように構成します。アクセラレータなしで 3 番目のワーカープールを構成し、アクセラレータなしで減らすサーバーコンテナーイメージを使用し、マシンタイプを選択します。帯域幅を優先します。

D. 最初の 2 つのプールのマシンが TPU を持つように構成します。トレーニングコードが実行されるコンテナーイメージを使用するには、TPU を持つように 3 番目のプールを構成し、reductionserver コンテナーイメージを使用します。

Professional-Machine-Learning-Engineer 試験問題 4

オンライン予測のために Vertex Al にデプロイする予定の XGBoost モデルをトレーニングしました。現在、モデルを Vertex Al Model Registry にアップロードしています。オンライン予測リクエストを最小限の遅延で返す説明メソッドを構成する必要があります。また、モデルの特徴属性が時間の経過とともに大きく変化したときにアラートを受け取ることも必要です。あなたは何をするべきか？

A. 1 パス数 5 でサンプリングされた Shapley を説明方法として指定します。
2 モデルを Vertex Al Endpoints に展開します。
3. 監視目標として予測ドリフトを使用するモデル監視ジョブを作成します。

B. 1 パス数 5 で説明方法として統合勾配を指定します。
2 モデルを Vertex Al Endpoints に展開します。
3. 監視目標として予測ドリフトを使用するモデル監視ジョブを作成します。

C. 1. パス数 50 の説明メソッドとしてサンプリングされた Shapley を指定します。
2. モデルを Vertex Al Endpoints にデプロイします。
3. トレーニングとサービングのスキューを監視目標として使用するモデル監視ジョブを作成します。

D. 1 パス数 50 の説明方法として統合勾配を指定します。
2. モデルを Vertex Al Endpoints にデプロイします。
3 トレーニングとサービングのスキューを監視目標として使用するモデル監視ジョブを作成します。

正解: A

サンプリングされた Shapley は、Shapley 値の高速かつスケーラブルな近似値です。Shapley 値は、モデル予測に対する各特徴の寄与を測定するゲーム理論的な概念です。サンプリングされた Shapley は、最小限の遅延で特徴属性を返すことができるため、オンライン予測リクエストに適しています。パスカウントパラメーターは、Shapley 値の推定に使用されるサンプルの数を制御します。値が低いほど、計算が高速になります。統合勾配は、ベースライン入力から実際の入力までのパスに沿った平均勾配を計算するもう 1 つの説明方法です。Integrated Gradients は、Sampled Shapley よりも正確ですが、計算量も多くなります。したがって、特にパス数が多いオンライン予測リクエストには推奨されません。予測ドリフトは、時間の経過に伴う特徴値またはラベルの分布の変化です。これはモデルのパフォーマンスと精度に影響を与える可能性があり、モデルの再トレーニングまたは再デプロイが必要になる場合があります。Vertex AI Model Monitoring を使用すると、デプロイされたモデルとエンドポイントの予測ドリフトを監視し、ドリフトが特定のしきい値を超えたときにアラートと通知を設定できます。通知を受信する電子メールアドレスを指定し、その情報を使用してトレーニングパイプラインを再トリガーし、モデルの更新バージョンをデプロイできます。これは、目標を達成するための最も直接的で便利な方法です。
トレーニングと提供のスキューは、モデルのトレーニングに使用されるデータとモデルの提供に使用されるデータの差です。また、モデルのパフォーマンスと精度に影響を与える可能性があり、データ品質の問題やモデルの古さを示している可能性があります。Vertex AI Model Monitoring を使用すると、デプロイされたモデルとエンドポイントのトレーニングと提供のスキューを監視し、スキューが特定のしきい値を超えた場合のアラートと通知を設定できます。
ただし、質問はデータ分布ではなくモデルの特徴属性に関するものであるため、これは質問とは関係ありません。参考文献:
※Vertex AI：説明方法
* Vertex AI: 設定の説明
* Vertex AI: 予測ドリフトのモニタリング
* Vertex AI: トレーニングとサービスのスキューを監視

Professional-Machine-Learning-Engineer 試験問題 5

あなたは最近、自動運転車用の画像セグメンテーションモデルの最初のバージョンを構築しました。モデルをデプロイした後、曲線下面積 (AUC) メトリックの減少が観察されます。ビデオ録画を分析すると、トラフィックが非常に混雑している場合はモデルが失敗するが、トラフィックが少ない場合は期待どおりに機能することもわかります。この結果の最も考えられる理由は何ですか?

A. モデルは、交通量が少ないエリアでは過剰適合し、交通量が多いエリアでは過小適合します。

B. 出力ノードから入力ノードへの逆伝播中に勾配が小さくなり、消滅します。

C. AUC は、この分類モデルを評価するための正しい指標ではありません。

D. モデルのトレーニングに使用された混雑したエリアを表すデータが多すぎます。

他のバージョン: 467Google.Professional-Machine-Learning-Engineer.v2025-04-14.q216; 602Google.Professional-Machine-Learning-Engineer.v2023-10-04.q116; 742Google.Professional-Machine-Learning-Engineer.v2022-12-19.q66

最新アップロード: 101SAP.C-C4H56I-34.v2025-09-08.q74; 101Salesforce.Agentforce-Specialist.v2025-09-08.q82; 101Salesforce.Public-Sector-Solutions.v2025-09-08.q93; 101Fortinet.FCP_FAZ_AD-7.4.v2025-09-08.q75; 101SAP.C-S4TM-2023.v2025-09-08.q86; 130SAP.C-TS412-2021.v2025-09-06.q90; 173Microsoft.MB-700.v2025-09-06.q281; 146Docker.DCA.v2025-09-06.q175; 117SAP.C-BCFIN-2502.v2025-09-05.q12; 130Avaya.77201X.v2025-09-05.q58

Professional-Machine-Learning-Engineer 試験問題 1

Professional-Machine-Learning-Engineer 試験問題 2

Professional-Machine-Learning-Engineer 試験問題 3

Professional-Machine-Learning-Engineer 試験問題 4

Professional-Machine-Learning-Engineer 試験問題 5

PDFファイルをダウンロード