【发布时间】:2018-11-19 22:37:36
【问题描述】:
谁能解释如何解释coefficientMatrix、interceptVector 、Confusion matrix
multinomial logistic regression。
根据 Spark 文档:
通过多项逻辑 (softmax) 回归支持多类分类。在多项逻辑回归中,该算法生成 K 组系数,或维度为 K×J 的矩阵,其中 K 是结果类的数量,J 是特征的数量。如果算法适合截距项,则长度为 K 的截距向量可用。
我使用 spark ml 2.3.0 翻了一个例子,得到了这个结果。
如果我分析我得到的:
coefficientMatrix 的维度为 5 * 11
interceptVector 的维度为 5
如果是这样,为什么the Confusion matrix 的维度是4 * 4?
另外,谁能解释一下coefficientMatrix,interceptVector ?
为什么我得到负系数?
如果分类后的类数是 5,为什么我在the confusion matrix 中得到 4 行?
编辑
我忘了说我还是机器学习的初学者,我在谷歌上的搜索没有帮助,所以也许我得到了赞成票:)
【问题讨论】:
标签: apache-spark classification logistic-regression apache-spark-ml confusion-matrix