DP-100 試験問題 181

Azure MachineLearningStudioで実験を作成します-10.000行を含むトレーニングデータセットを追加します。最初の9.000行は、クラス0(90パーセント)を表します。最初の1.000行は、クラス1(10パーセント)を表します。
トレーニングセットは、2つのクラス間で不均衡です。データ行を使用して、クラス1のトレーニング例の数を4,000に増やす必要があります。Synthetic Minority Oversampling Technique(SMOTE)モジュールを実験に追加します。
モジュールを構成する必要があります。
どの値を使用する必要がありますか?回答するには、回答領域のダイアログボックスで適切なオプションを選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。

DP-100 試験問題 182

Azure Machine Learningを使用して、モデルをリアルタイムWebサービスとしてデプロイします。
サービスの開始時にモデルがロードされ、受信時に新しいデータをスコアリングするために使用されることを保証する、サービスのエントリスクリプトを作成する必要があります。
スクリプトにどの関数を含める必要がありますか?答えるには、適切な機能を正しいアクションにドラッグします。各機能は、1回使用することも、複数回使用することも、まったく使用しないこともできます。コンテンツを表示するには、ペイン間で分割バーをドラッグするか、スクロールする必要がある場合があります。注:正しい選択はそれぞれ1ポイントの価値があります。

DP-100 試験問題 183

10,000個のデータポイントと150個の特徴を持つ正規化された数値特徴セットを含むマルチクラス分類タスク用に作成されたデータセットがあります。
データポイントの75%をトレーニングに使用し、25%をテストに使用します。Pythonでscikit-learn機械学習ライブラリを使用しています。Xを使用して機能セットを示し、Yを使用してクラスラベルを示します。
次のPythonデータフレームを作成します。
トレーニングセットとテストセットの両方で、機能セットの次元を10個の機能に減らすには、主成分分析(PCA)メソッドを適用する必要があります。
コードセグメントをどのように完成させる必要がありますか?回答するには、回答エリアで適切なオプションを選択してください。
注:正しい選択はそれぞれ1ポイントの価値があります。

DP-100 試験問題 184

Azure Machine Learning Studioを使用して、大規模なデータストアからデータを取得しています。
システムクロックに基づくランダムサンプリングシードを使用して、テスト目的でデータのサブセットを作成する必要があります。
パーティションとサンプルモジュールを実験に追加します。
モジュールのプロパティを選択する必要があります。
どの値を選択する必要がありますか?回答するには、回答エリアで適切なオプションを選択してください。
注:正しい選択はそれぞれ1ポイントの価値があります。

DP-100 試験問題 185

二項分類モデルを作成します。
モデルのパフォーマンスを評価する必要があります。
使用できる2つの指標はどれですか?それぞれの正解は完全な解決策を提示します。
注:正しい選択はそれぞれ1ポイントの価値があります。