【问题标题】:k-fold cross validation for trial based data sets基于试验的数据集的 k 折交叉验证
【发布时间】:2017-03-01 10:48:11
【问题描述】:
我的 EEG 数据集包含一些受试者的数据,每个受试者有 4 个部分。
主要论文使用了以下方法:
它为主题使用了两个部分。第一部分用作训练数据,第二部分用作测试集。
我想使用 k 折交叉验证,但我需要注意论文方法的条件(第 1 部分作为训练集,第 2 部分作为测试集)。
首先,我需要将我的数据分成 k 部分,然后使用 k-1 部分作为训练,另外 1 个作为测试,并在 k 循环中执行此过程。
我的数据分为两个单独的部分,我怎样才能看到一个部分中的两个部分?可以混合数据吗?
如果我混合它们,我应该如何使用纸张的条件?
提前致谢。
【问题讨论】:
标签:
modeling
cross-validation
【解决方案1】:
首先你的问题很模糊!而且您没有解释条件是什么或应该是什么。
无论如何,在 K-Fold 中,您的数据被均匀地划分为 k 个大小相等的子样本。在这 k 个子样本中,每次分离一个子样本并用作您的验证集,其余的用作您的训练集。此过程重复 k 次(折叠),直到所有分区仅用作验证一次。然后可以对折叠的 k 个结果进行平均以产生单个估计。
我并没有完全理解您所说的主题,但如果论文分别使用第 1 部分和第 2 部分进行训练和测试(验证),您可以执行以下任一操作:
- 您可以将这两个部分组合起来,然后在这个新合并的数据集上应用 K-fold。
- 搁置测试数据(第二部分),在第一部分运行 k-fold,因此您将获得 k-1 折用于训练,1 折用于验证
您用于查找/微调您的参数/网络/模型,
和一个您最终用于测试的测试集