P-S4FIN-2021 試験問題 61

クレジットカード会社は、新しいクレジットカード申請者がクレジットカードの支払いをデフォルトにするかどうかを予測するのに役立つクレジットスコアリングモデルを構築したいと考えています。同社は、何千もの生の属性を持つ多数のソースからデータを収集しています。分類モデルをトレーニングするための初期の実験では、多くの属性が高度に相関しており、多数の機能によってトレーニング速度が大幅に低下し、過剰適合の問題があることが明らかになりました。
このプロジェクトのデータサイエンティストは、元のデータセットから多くの情報を失うことなく、モデルのトレーニング時間を短縮したいと考えています。
データサイエンティストが目的を達成するために使用する必要がある特徴工学手法はどれですか?
  • P-S4FIN-2021 試験問題 62

    データサイエンティストは、複数のクラスを持つデータセットで多層知覚(MLP)をトレーニングしています。対象のターゲットクラスは、データセット内の他のクラスと比較して一意ですが、許容可能なリコールメトリックを達成していません。データサイエンティストは、MLPの非表示レイヤーの数とサイズを変更しようとしましたが、結果は大幅に改善されていません。リコールを改善するためのソリューションは、可能な限り迅速に実装する必要があります。
    これらの要件を満たすためにどの手法を使用する必要がありますか?
  • P-S4FIN-2021 試験問題 63

    次のジョブ送信スクリプトを使用してテキストを要約するために、AlPlatformでLSTMベースのモデルをトレーニングしています。

    モデルの精度を大幅に損なうことなく、トレーニング時間を最小限に抑える必要があります。あなたは何をするべきか?
  • P-S4FIN-2021 試験問題 64

    個人情報(Pll)を含む可能性のあるファイルをGoogleCloudにストリーミングするリアルタイム予測エンジンを構築しています。Cloud Data Loss Prevention(DLP)APIを使用してファイルをスキャンするとします。許可されていない個人がPllにアクセスできないようにするにはどうすればよいですか?
  • P-S4FIN-2021 試験問題 65

    あなたは最近、数千のデータセットを持つ企業規模の企業に加わりました。BigQueryの各テーブルには正確な説明があることを知っており、AIプラットフォームで構築しているモデルに使用する適切なBigQueryテーブルを検索しています。必要なデータをどのように見つける必要がありますか?