Databricks-Certified-Professional-Data-Scientist 試験問題 26

レコメンダーシステムの設計に使用できる手法は次のうちどれですか?
  • Databricks-Certified-Professional-Data-Scientist 試験問題 27

    あなたは電子メールスパムフィルタリングの割り当てに取り組んでいますが、これに取り組んでいる間、あなたは新しい単語があることに気づきます。
    HadoopExamは電子メールで送信されます。ソリューションでは、これまでこの単語に出くわすことはありません。したがって、この単語がいずれかの電子メールで送信される可能性はゼロになる可能性があります。では、次のアルゴリズムのどれがゼロ確率を回避するのに役立ちますか?
  • Databricks-Certified-Professional-Data-Scientist 試験問題 28

    クラスタリングは、次の目標を持つ教師なし学習の一種です。
  • Databricks-Certified-Professional-Data-Scientist 試験問題 29

    主成分分析(PCA)に基づく方法では、次のように特徴を評価します。
  • Databricks-Certified-Professional-Data-Scientist 試験問題 30

    相互に依存しない関係を持つA、B、C、D、およびEと呼ばれる5つの独立変数を使用してデータセットをモデル化しました。また、変数A、B、およびCは連続であり、変数DおよびEは離散です(混合モード)。 。
    ここで、変数の期待値を計算する必要があります。たとえば、Aとすると、次の計算のどれを優先しますか。