【问题标题】:Deep learning/Image recognition- How to compose dataset for one category recognition深度学习/图像识别 - 如何为一个类别识别组合数据集
【发布时间】:2017-05-18 10:33:14
【问题描述】:
我正在使用英特尔深度学习 SDK(基于 Caffe)。
我想为识别硬币的能力编写照片数据集。
SDK 需要以下格式的数据集:
Root
--> category a
--> photos
--> category b
--> photos
...
并且要求至少有 2 个类别。
有什么想法吗?
【问题讨论】:
标签:
computer-vision
neural-network
deep-learning
caffe
image-recognition
【解决方案1】:
在您的情况下,您应该有一个“硬币”类别和“非硬币”类别。
您的网络应该看到“非硬币”的图像,以便将这些图像与“硬币”图像区分开来。
您可以考虑分阶段训练(又名“硬负挖掘”):
(1) model_0 <- training with cons/non-coins images
(2) for k = 1..K iterations do:
(2.1) use model_{k-1} to classify additional training images
(2.2) add images wrongly classified by model_{k-1} to training set
(2.3) model_k <- training with extended training set
(3) output model_K