【发布时间】:2013-11-21 12:46:28
【问题描述】:
所以我在理解交叉验证如何在机器学习中进行模型构建时遇到了一些麻烦。
假设我有一个包含 100 个样本的数据集,我执行 10 折交叉验证。
据我了解,我会将数据集分成 10 个一组,然后用其中的 9 个组在其中一组上进行训练和测试。
最后,我会有 10 个不同的分类器,以及整个数据集的预测结果。
然后我将如何使用这些结果对第 101 个新样本进行测试?
之前有人告诉我,这 10 个不同的分类器只是被平均了,结果被用来测试新的数据点,但是这到底是怎么做的呢?是否所有 10 个分类器都在新数据点上运行,并且最后的置信度值平均得到用于分类的最终分类器?还是 10 个生成的分类器以某种方式聚合为一个?我认为这是第二种情况,但现在我想起来了,我不确定你会如何“组合”不同的分类器。
【问题讨论】:
标签: machine-learning