Professional-Machine-Learning-Engineer 試験問題 56

あなたは、カスタマー サポートの電子メールを分類するモデルを開発しています。オンプレミス システム上の小規模なデータセットを使用して TensorFlow Estimator でモデルを作成しましたが、高いパフォーマンスを確保するには大規模なデータセットを使用してモデルをトレーニングする必要があります。モデルを Google Cloud に移植し、オンプレミスからクラウドへの移行を容易にするために、コードのリファクタリングとインフラストラクチャのオーバーヘッドを最小限に抑えたいと考えています。あなたは何をするべきか?
  • Professional-Machine-Learning-Engineer 試験問題 57

    あなたは産業機器製造会社のデータサイエンティストです。あなたは、すべての工場から収集されたセンサー データに基づいて、会社の製造工場の電力消費量を推定する回帰モデルを開発しています。センサーは毎日数千万件のレコードを収集します。現在の日付までに収集されたすべてのデータを使用するモデルの毎日のトレーニング実行をスケジュールする必要があります。モデルをスムーズに拡張し、必要な開発作業を最小限に抑えたいと考えています。あなたは何をするべきか?
  • Professional-Machine-Learning-Engineer 試験問題 58

    あるゲーム会社は、無料でプレイを開始できるが、特定の機能を使用する場合には料金を支払う必要があるオンライン ゲームを立ち上げました。同社は、新規ユーザーが 1 年以内に有料ユーザーになるかどうかを予測する自動システムを構築する必要があります。同社は 100 万人のユーザーからラベル付きのデータセットを収集しました。
    トレーニング データセットは 1,000 の肯定的なサンプル (1 年以内に支払いを終えたユーザーからのもの) で構成されており、
    999,000 のネガティブサンプル (有料機能を使用しなかったユーザーから)。各データ サンプルは、ユーザーの年齢、デバイス、場所、プレイ パターンを含む 200 の特徴で構成されます。
    このデータセットをトレーニングに使用して、データ サイエンス チームは、以下に収束するランダム フォレスト モデルをトレーニングしました。
    トレーニング セットでは 99% の精度。ただし、テスト データセットの予測結果は満足のいくものではありませんでした。この問題を軽減するには、データ サイエンス チームが次のどのアプローチを取る必要がありますか? (2つお選びください。)
  • Professional-Machine-Learning-Engineer 試験問題 59

    あなたは、販売数の予測を担当する生産システムを構築および管理しました。量産モデルは市場の変化に対応する必要があるため、モデルの精度は非常に重要です。実稼働環境にデプロイされて以来、モデルは変更されていません。しかし、モデルの精度は着実に低下しています。モデル精度の着実な低下の原因として最も考えられる問題は何ですか?
  • Professional-Machine-Learning-Engineer 試験問題 60

    カスタム ライブラリを必要とする Kubeflow パイプラインの単体テストを作成しました。Cloud Source Repositories の開発ブランチへの新しいプッシュごとに単体テストの実行を自動化したいと考えています。あなたは何をするべきか?