Professional-Machine-Learning-Engineer 試験問題 1

機械学習スペシャリストは、Amazon Athena を使用して Amazon S3 上のデータセットにクエリを実行するプロセスを構築する必要があります。データセットには、プレーンテキストの CSV ファイルとして保存された 800,000 件を超えるレコードが含まれています。各レコードには次の内容が含まれます
200 列で、サイズは約 1.5 MB です。ほとんどのクエリは 5 ~ 10 列のみにまたがります。
機械学習スペシャリストは、クエリの実行時間を最小限に抑えるためにデータセットをどのように変換する必要がありますか?
  • Professional-Machine-Learning-Engineer 試験問題 2

    You have trained a deep neural network model on Google Cloud. The model has low loss on the training data, but is performing worse on the validation dat a. You want the model to be resilient to overfitting. Which strategy should you use when retraining the model?
  • Professional-Machine-Learning-Engineer 試験問題 3

    あなたは、大規模なデータセットを使用して会社のカスタム言語モデルをトレーニングしています。Vertex Al で ReductionServer 戦略を使用する予定です。分散トレーニング ジョブのワーカー プールを構成する必要があります。
    あなたは何をするべきか?
  • Professional-Machine-Learning-Engineer 試験問題 4

    オンライン予測のために Vertex Al にデプロイする予定の XGBoost モデルをトレーニングしました。現在、モデルを Vertex Al Model Registry にアップロードしています。オンライン予測リクエストを最小限の遅延で返す説明メソッドを構成する必要があります。また、モデルの特徴属性が時間の経過とともに大きく変化したときにアラートを受け取ることも必要です。あなたは何をするべきか?
  • Professional-Machine-Learning-Engineer 試験問題 5

    あなたは最近、自動運転車用の画像セグメンテーション モデルの最初のバージョンを構築しました。モデルをデプロイした後、曲線下面積 (AUC) メトリックの減少が観察されます。ビデオ録画を分析すると、トラフィックが非常に混雑している場合はモデルが失敗するが、トラフィックが少ない場合は期待どおりに機能することもわかります。この結果の最も考えられる理由は何ですか?