【发布时间】:2019-05-08 06:13:24
【问题描述】:
这是一个关于训练 CNN 的一般性问题,但我使用的是 YOLO。 我已经通过标记来自不同相机视频(在类似环境中)的一些数据来开始我的“人”检测训练集......每次我为新相机添加新数据时,我都在重新训练 YOLO,这实际上改进了检测对于这台相机。对于训练,我将我的数据随机分成训练/验证集。我使用验证集来计算准确性。这并没有过度拟合,因为之前的所有数据也都用于训练。
现在,我已经收集了超过 100 000 个标记数据。由于我的数据集非常大,我希望此时不必再训练了。但看起来我仍然需要这样做。如果我得到一个新的相机视频,标记 500-1000 个样本,将它们添加到我的庞大数据集中并再次训练,那么这台相机的准确性正在提高。 我真的不明白为什么。为什么我仍然需要向我的集合中添加新数据?为什么新数据的准确性提高了很多,而成千上万的现有数据却被“绘制”了?我是否可以停止训练,因为添加新数据不会提高准确性?
感谢您分享您的想法和想法!
【问题讨论】:
标签: deep-learning conv-neural-network training-data yolo