【发布时间】:2021-03-11 11:07:56
【问题描述】:
对于分类任务,我使用sklearn VotingClassifier 来集成随机森林和额外树分类器,参数设置为voting='hard'。我不明白它是如何正常工作的,因为两个基于树的模型都已经使用投票技术给出了最终预测。他们如何使用硬投票结合起来工作?另外,如果两个模型之间存在平局?
谁能举例说明一下?
【问题讨论】:
-
当您阅读 sklearn 文档(请提供链接?)时,它告诉您什么?当你编写代码来测试它时,它教会了你什么?否则,这是not an on-topic question for SO,你不能指望别人为你做你的工作。如果 sklearn 文档缺失或不足,请在 sklearn 上提交 docbug。
-
可能是我的问题没有解释我的意思。sklearn 结束并没有错。我只是在理解两个分类器特别是基于树的分类器的硬投票的内部工作方面存在问题。
-
我已经了解了不同的分类器的工作原理,在软投票的情况下,它将检查每个类的概率。在硬投票的情况下,它将获得一个班级的多数票。但是,如果我将随机森林 (RF) 和额外树 (ET) 结合起来,它们的内部工作就像它们通过计算来自多个决策树的投票来给出最终预测。我只是想知道它如何结合使用。我问是否有人用例子教我,比如有 4 个课程,RF 和 ET。两者都有决策树,并且投票是针对特定类别的组合计算?
-
是的,我已经阅读了 sklearn 的文档,scikit-learn.org/stable/modules/generated/…,以及不同的博客、网站搜索、研究论文,但我的观点仍然是关于两种算法的结合。有很多网站链接,我可以作为新学习者分享,但很难正确找到我的答案。
标签: python machine-learning scikit-learn classification