【发布时间】:2015-04-21 14:25:01
【问题描述】:
我有一个关于交叉验证的问题:我正在使用朴素贝叶斯分类器按作者对博客文章进行分类。当我在没有 k 折交叉验证的情况下验证我的数据集时,我得到了 0.6 的准确度得分,但是当我进行 k 折交叉验证时,每折都呈现更高的准确度(大于 0.8)。
例如:
(手动拆分):验证集大小:1452,训练集大小:13063,准确度:0.6033057851239669
然后
(使用 k 折叠):折叠 0 -> 训练集大小:13063,验证集大小:1452 准确度:0.8039702233250621(所有折叠都超过 0.8)
等等……
为什么会这样?
【问题讨论】:
-
请不要在多个 SE 网站上交叉发布您的问题...stats.stackexchange.com/questions/138449/…
标签: machine-learning naivebayes