【发布时间】:2015-09-22 18:05:29
【问题描述】:
我正在使用 spark.mllib.classification.{LogisticRegressionModel, LogisticRegressionWithSGD} 和 spark.mllib.tree.RandomForest 进行分类。使用这些包我生成分类模型。只有这些模型可以预测每个实例的特定类。在 Weka 中,我们可以获得每个实例属于每个类别的确切概率。我们如何使用这些包来做到这一点?
在 LogisticRegressionModel 中我们可以设置阈值。所以我创建了一个函数来检查不同阈值上每个点的结果。但这对于 RandomForest 是无法做到的(请参阅 How to set cutoff while training the data in Random Forest in Spark)
【问题讨论】:
-
不幸的是,使用 MLLIb 您无法获得分类模型的每个实例的概率。
-
谢谢,您知道我们将来是否可以这样做?
标签: apache-spark random-forest logistic-regression apache-spark-mllib