【问题标题】:Does weka balance the train/test sets across classes in cross validation?weka 是否在交叉验证中平衡跨类的训练/测试集?
【发布时间】:2013-01-15 21:36:42
【问题描述】:

当我对 m 个类执行 n 折交叉验证时,在每一折中,训练集和测试集是否平衡?通过平衡,我的意思是询问训练和测试集中的每个类是否有(几乎)相同的样本集。

【问题讨论】:

    标签: machine-learning weka cross-validation


    【解决方案1】:

    如果我理解正确这部分:

    我的意思是问训练集和测试集中的每个类是否有(几乎)相同的样本集。

    ...我认为您指的是分层交叉验证:每个折叠的类比例与整个数据集的类比例相同。

    是的,在 Weka 中当然可以,但您可能需要查阅文档。这些可能有帮助吗?

    http://weka.wikispaces.com/Primer

    http://weka.wikispaces.com/Generating+cross-validation+folds+(Java+approach)

    http://weka.sourceforge.net/doc/weka/filters/supervised/instance/StratifiedRemoveFolds.html

    【讨论】:

    • 感谢您的链接,我知道有人可以做到。但我想知道当我们在实验器中进行交叉验证时,weka 会做什么。
    • Weka 默认使用 GUI (Weka Explorer) 时会进行分层交叉验证。这可以通过查看您的 分类器输出 文本并查看短语 === Stratified cross-validation === 来验证。希望这会有所帮助。
    猜你喜欢
    • 2021-12-10
    • 2011-12-16
    • 2020-12-05
    • 2016-01-29
    • 2021-03-04
    • 2018-04-03
    • 2016-04-04
    • 2018-07-26
    • 2021-10-08
    相关资源
    最近更新 更多