Databricks-Certified-Professional-Data-Scientist 試験問題 26
レコメンダーシステムの設計に使用できる手法は次のうちどれですか?
Databricks-Certified-Professional-Data-Scientist 試験問題 27
あなたは電子メールスパムフィルタリングの割り当てに取り組んでいますが、これに取り組んでいる間、あなたは新しい単語があることに気づきます。
HadoopExamは電子メールで送信されます。ソリューションでは、これまでこの単語に出くわすことはありません。したがって、この単語がいずれかの電子メールで送信される可能性はゼロになる可能性があります。では、次のアルゴリズムのどれがゼロ確率を回避するのに役立ちますか?
HadoopExamは電子メールで送信されます。ソリューションでは、これまでこの単語に出くわすことはありません。したがって、この単語がいずれかの電子メールで送信される可能性はゼロになる可能性があります。では、次のアルゴリズムのどれがゼロ確率を回避するのに役立ちますか?
Databricks-Certified-Professional-Data-Scientist 試験問題 28
クラスタリングは、次の目標を持つ教師なし学習の一種です。
Databricks-Certified-Professional-Data-Scientist 試験問題 29
主成分分析(PCA)に基づく方法では、次のように特徴を評価します。
Databricks-Certified-Professional-Data-Scientist 試験問題 30
相互に依存しない関係を持つA、B、C、D、およびEと呼ばれる5つの独立変数を使用してデータセットをモデル化しました。また、変数A、B、およびCは連続であり、変数DおよびEは離散です(混合モード)。 。
ここで、変数の期待値を計算する必要があります。たとえば、Aとすると、次の計算のどれを優先しますか。
ここで、変数の期待値を計算する必要があります。たとえば、Aとすると、次の計算のどれを優先しますか。