【问题标题】:how can i improve on my convnet performance with small dataset如何使用小数据集提高我的 convnet 性能
【发布时间】:2019-05-30 00:22:28
【问题描述】:

我有一个非常小的图像数据集(大约 8 张图像)。我知道我的模型可能会导致对小数据集的过度拟合,我想了解一些关于如何处理数据集如此小的情况的想法。

【问题讨论】:

  • 您总是可以收集更多数据,还是对您有限制?
  • 有限制

标签: machine-learning


【解决方案1】:

处理此类问题的最佳方法是使用图像增强。有几个库可以提供这个,比如 opencv2、keras、scikit-image。图像增强背后的基本思想是通过在数据中引入某些变化(例如旋转图像、在某些侧面模糊图像、放大/缩小图像、更改颜色、翻转图像等),从一张图像中人工创建更多图像更多的。您可以从一张图像创建 10x、20x、40x 等图像。

此方法将帮助您生成更多图像,但请记住,8 张图像是一个非常小的数据,这些新的增强图像将在某种程度上具有与原始图像相似的特征。

【讨论】:

  • 你推荐使用 GAN 来帮助解决这个问题吗?另外,您认为迁移学习会改善情况吗?
  • 迁移学习背后的概念是获得一个能够检测数据中特征的预训练模型,然后该模型会根据您的数据进行微调。由于您没有足够的数据从头开始训练一个好的模型,迁移学习可能会有所帮助。 GAN 也可以提供帮助,因为它们是一种先进的图像增强方法。
猜你喜欢
  • 2020-09-16
  • 2015-05-12
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2010-09-06
  • 2011-01-01
  • 1970-01-01
  • 2015-08-16
相关资源
最近更新 更多