【发布时间】:2018-07-16 00:41:03
【问题描述】:
我正在应用 CNN 对手势进行分类,我有 10 个手势,每个手势有 100 个图像。我构建的模型在训练数据上的准确率约为 97%,在测试数据上的准确率达到 89%。我可以说我的模型过拟合还是可以接受这样的精度图(如下所示)?
【问题讨论】:
标签: machine-learning neural-network conv-neural-network
我正在应用 CNN 对手势进行分类,我有 10 个手势,每个手势有 100 个图像。我构建的模型在训练数据上的准确率约为 97%,在测试数据上的准确率达到 89%。我可以说我的模型过拟合还是可以接受这样的精度图(如下所示)?
【问题讨论】:
标签: machine-learning neural-network conv-neural-network
向训练集添加更多数据
当您的训练集中有大量数据(各种实例)时,最好创建一个过拟合模型。
示例:假设您只想检测一个手势说“竖起大拇指”(二元分类问题),并且您创建了包含大约 1000 张图像的正向训练集,其中图像被旋转、平移、缩放、不同颜色、不同角度、视角多变、背景杂乱……等等。如果你的训练准确率是 99%,那么你的测试准确率也会接近。
因为我们的训练集足够大,可以覆盖正类的所有实例,所以即使模型过度拟合,它也会在测试集上表现良好,因为测试集中的实例只会有轻微的变化训练集中的实例。
在您的情况下,您的模型很好,但如果您可以添加更多数据,您将获得更好的准确性。
要添加什么样的数据?
手动检查模型出错的测试样本并检查模式,如果您能找出哪种样本出错,您可以将此类样本添加到您的训练集中并再次重新训练。
【讨论】: