【发布时间】:2021-04-15 08:31:26
【问题描述】:
我对模型验证感到困惑。
我为 6 种不同的算法做了什么:
-->分离了我的数据集 75/25(训练/测试)--> 我没有改动的测试。
-->使用训练集我做了以下事情:
- 拆分为 4 倍(外部)并执行嵌套重复(五次)十倍(内部)交叉验证。通过随机搜索 10 次调整超参数。 (留一个策略)
- 提取指标(ROC 曲线、acc、特异性等)并获得最佳模型的参数。
这就是问题所在:
我还有一个未动过的测试集(从一开始的拆分开始),我该怎么处理它?直接套用最好的模型,看看性能?还是使用整个训练集重新训练具有最佳参数的最佳模型,然后应用测试集?
或者这里的一切都错了?
【问题讨论】:
标签: machine-learning cross-validation