weka 是否在交叉验证中平衡跨类的训练/测试集？答案

【问题标题】：Does weka balance the train/test sets across classes in cross validation?weka 是否在交叉验证中平衡跨类的训练/测试集？
【发布时间】：2013-01-15 21:36:42
【问题描述】：

当我对 m 个类执行 n 折交叉验证时，在每一折中，训练集和测试集是否平衡？通过平衡，我的意思是询问训练和测试集中的每个类是否有（几乎）相同的样本集。

【问题讨论】：

标签： machine-learning weka cross-validation

【解决方案1】：

如果我理解正确这部分：

我的意思是问训练集和测试集中的每个类是否有（几乎）相同的样本集。

...我认为您指的是分层交叉验证：每个折叠的类比例与整个数据集的类比例相同。

是的，在 Weka 中当然可以，但您可能需要查阅文档。这些可能有帮助吗？

http://weka.wikispaces.com/Primer

http://weka.wikispaces.com/Generating+cross-validation+folds+(Java+approach)

http://weka.sourceforge.net/doc/weka/filters/supervised/instance/StratifiedRemoveFolds.html

【讨论】：

感谢您的链接，我知道有人可以做到。但我想知道当我们在实验器中进行交叉验证时，weka 会做什么。
Weka 默认使用 GUI (Weka Explorer) 时会进行分层交叉验证。这可以通过查看您的 分类器输出 文本并查看短语 === Stratified cross-validation === 来验证。希望这会有所帮助。