基于试验的数据集的 k 折交叉验证答案

【问题标题】：k-fold cross validation for trial based data sets基于试验的数据集的 k 折交叉验证
【发布时间】：2017-03-01 10:48:11
【问题描述】：

我的 EEG 数据集包含一些受试者的数据，每个受试者有 4 个部分。
主要论文使用了以下方法：
它为主题使用了两个部分。第一部分用作训练数据，第二部分用作测试集。
我想使用 k 折交叉验证，但我需要注意论文方法的条件（第 1 部分作为训练集，第 2 部分作为测试集）。
首先，我需要将我的数据分成 k 部分，然后使用 k-1 部分作为训练，另外 1 个作为测试，并在 k 循环中执行此过程。我的数据分为两个单独的部分，我怎样才能看到一个部分中的两个部分？可以混合数据吗？如果我混合它们，我应该如何使用纸张的条件？提前致谢。

【问题讨论】：

标签： modeling cross-validation

【解决方案1】：

首先你的问题很模糊！而且您没有解释条件是什么或应该是什么。
无论如何，在 K-Fold 中，您的数据被均匀地划分为 k 个大小相等的子样本。在这 k 个子样本中，每次分离一个子样本并用作您的验证集，其余的用作您的训练集。此过程重复 k 次（折叠），直到所有分区仅用作验证一次。然后可以对折叠的 k 个结果进行平均以产生单个估计。

我并没有完全理解您所说的主题，但如果论文分别使用第 1 部分和第 2 部分进行训练和测试（验证），您可以执行以下任一操作：

您可以将这两个部分组合起来，然后在这个新合并的数据集上应用 K-fold。
搁置测试数据（第二部分），在第一部分运行 k-fold，因此您将获得 k-1 折用于训练，1 折用于验证您用于查找/微调您的参数/网络/模型，和一个您最终用于测试的测试集

【讨论】：