【发布时间】:2013-01-15 21:36:42
【问题描述】:
当我对 m 个类执行 n 折交叉验证时,在每一折中,训练集和测试集是否平衡?通过平衡,我的意思是询问训练和测试集中的每个类是否有(几乎)相同的样本集。
【问题讨论】:
标签: machine-learning weka cross-validation
当我对 m 个类执行 n 折交叉验证时,在每一折中,训练集和测试集是否平衡?通过平衡,我的意思是询问训练和测试集中的每个类是否有(几乎)相同的样本集。
【问题讨论】:
标签: machine-learning weka cross-validation
如果我理解正确这部分:
我的意思是问训练集和测试集中的每个类是否有(几乎)相同的样本集。
...我认为您指的是分层交叉验证:每个折叠的类比例与整个数据集的类比例相同。
是的,在 Weka 中当然可以,但您可能需要查阅文档。这些可能有帮助吗?
http://weka.wikispaces.com/Primer
http://weka.wikispaces.com/Generating+cross-validation+folds+(Java+approach)
http://weka.sourceforge.net/doc/weka/filters/supervised/instance/StratifiedRemoveFolds.html
【讨论】:
=== Stratified cross-validation === 来验证。希望这会有所帮助。