【发布时间】:2015-12-13 09:54:24
【问题描述】:
我有两个二进制分类器,一个用于体育,另一个用于娱乐。我正在为二元分类器使用决策树。如果两个分类器都预测正确,即文档既是体育又是娱乐,有没有办法确定哪个得分更高? 基本上,我想知道如何为我的每个预测得出一个分数。 谢谢
【问题讨论】:
-
有很多衡量标准:召回率、F-score、准确率……此外,您还需要一个测试平台……
标签: machine-learning decision-tree
我有两个二进制分类器,一个用于体育,另一个用于娱乐。我正在为二元分类器使用决策树。如果两个分类器都预测正确,即文档既是体育又是娱乐,有没有办法确定哪个得分更高? 基本上,我想知道如何为我的每个预测得出一个分数。 谢谢
【问题讨论】:
标签: machine-learning decision-tree
“更好的分数”是什么意思?
如果您想评估每个预测变量,您可以使用已经提到的度量。
如果说“有没有办法确定哪个得分更高”是指“我如何确定该文档与体育文档的相关性高于与娱乐文档的相关性”,那么决策树方法就是使用不是要走的路。您应该遵循 TF - IDF 和余弦相似度方法,以确定文档的相似度。
以下答案可能真的很有用:
【讨论】: