P-S4FIN-2021 試験問題 51
最近、組織のフレームワークに固有の重要な依存関係を使用するカスタムニューラルネットワークを設計および構築しました。GoogleCloudのマネージドトレーニングサービスを使用してモデルをトレーニングする必要があります。ただし、MLフレームワークと関連する依存関係は、AlPlatformTrainingではサポートされていません。また、モデルとデータの両方が大きすぎて、単一のマシンのメモリに収まりません。選択したMLフレームワークは、スケジューラー、ワーカー、およびサーバーの分散構造を使用します。あなたは何をするべきか?
P-S4FIN-2021 試験問題 52
GoogleCloudでディープニューラルネットワークモデルをトレーニングしました。モデルのトレーニングデータの損失は少ないですが、検証データのパフォーマンスが低下しています。モデルが過剰適合に対して弾力性があるようにする必要があります。モデルを再トレーニングするときに、どの戦略を使用する必要がありますか?
P-S4FIN-2021 試験問題 53
データサイエンティストは、企業のeコマースプラットフォームの不正なユーザーアカウントを特定する必要があります。同社は、新しく作成されたアカウントが以前に知られている不正なユーザーに関連付けられているかどうかを判断する機能を望んでいます。
データサイエンティストは、AWS Glueを使用して、取り込み中に会社のアプリケーションログをクレンジングしています。
データサイエンティストが不正なアカウントを特定できるようにする戦略はどれですか?
データサイエンティストは、AWS Glueを使用して、取り込み中に会社のアプリケーションログをクレンジングしています。
データサイエンティストが不正なアカウントを特定できるようにする戦略はどれですか?
P-S4FIN-2021 試験問題 54
チームは、画像に運転免許証、パスポート、またはクレジットカードが含まれているかどうかを予測するモデルを構築する必要があります。データエンジニアリングチームはすでにパイプラインを構築し、運転免許証付きの10,000枚の画像、パスポート付きの1,000枚の画像、クレジットカード付きの1,000枚の画像で構成されるデータセットを生成しました。ここで、次のラベルマップを使用してモデルをトレーニングする必要があります:['driversjicense'、'passport'、'credit_card']。どの損失関数を使用する必要がありますか?
P-S4FIN-2021 試験問題 55
機械学習スペシャリストは、AmazonAthenaを使用してAmazonS3上のデータセットをクエリするプロセスを構築する必要があります。データセットには、プレーンテキストのCSVファイルとして保存された800,000を超えるレコードが含まれています。各レコードには
200列で、サイズは約1.5MBです。ほとんどのクエリは5〜10列のみに及びます。
機械学習スペシャリストは、クエリの実行時間を最小限に抑えるためにデータセットをどのように変換する必要がありますか?
200列で、サイズは約1.5MBです。ほとんどのクエリは5〜10列のみに及びます。
機械学習スペシャリストは、クエリの実行時間を最小限に抑えるためにデータセットをどのように変換する必要がありますか?