【发布时间】:2015-06-24 19:54:57
【问题描述】:
我知道类似的问题已经在这里提出过几次,但我还有一点不清楚。
我有 1098 张图像要分类。作为一般规则(根据我的阅读),数据的拆分是
80/20 - 训练/测试
80% 的训练数据
80/20 或 90/10 用于 20 倍或 10 倍交叉验证。
现在我面临的问题是数据的原始 80/20 拆分是随机完成的。因此,如果我将数据的随机抽样(训练/测试用例)重复一百次并执行交叉验证,我发现最佳 SVM 参数正在发生变化。
所以基本上,我对如何拆分数据感到困惑,当我随机拆分时,我不会在每个样本上得到可重复的结果。我该怎么办?
我正在使用带有 RBF 内核的 libsvm。对数据进行 30 次采样的示例给了我以下信息:
文本的格式不正确,因此我附上了一个指向包含该信息的文本文件的链接。 括号中的值为[C gamma]。
我如何选择最佳训练集以及如何选择最佳参数...有没有智能的方法?
【问题讨论】: