【发布时间】:2016-05-27 04:29:10
【问题描述】:
通过预先随机化训练集,我使用 sklearn.ensemble.RandomForestClassifier 获得了惊人的显着性能提升(+10% 的交叉验证准确率)。 这让我很困惑,因为 (a) RandomForestClassifier 无论如何都应该随机化训练数据;和 (b) 为什么例子的顺序如此重要?
有什么智慧之言吗?
【问题讨论】:
-
如果您可以共享数据/代码。社区会更好地帮助你。您可能会犯一些错误。
标签: machine-learning scikit-learn random-forest