【发布时间】:2023-03-10 12:40:01
【问题描述】:
从我读到的内容中,我一直认为交叉验证是这样执行的:
在k-fold交叉验证中,原始样本是随机的 划分为 k 个子样本。在 k 个子样本中,单个子样本 保留作为测试模型的验证数据,并且 剩余的 k-1 个子样本用作训练数据。这 然后将交叉验证过程重复 k 次(折叠),其中 k 个子样本中的每一个都只使用一次作为验证数据。这 然后可以对折叠的 k 个结果进行平均(或以其他方式组合) 产生一个单一的估计
因此构建了 k 个模型,最后一个是这些模型的平均值。 在 Weka 指南中写道,每个模型始终使用所有数据集构建。那么 Weka 中的交叉验证是如何工作的呢?模型是根据所有数据构建的吗?“交叉验证”意味着创建 k 折,然后对每个折进行评估,最终输出结果只是折的平均结果?
【问题讨论】:
标签: validation weka fold