【发布时间】:2021-02-02 05:15:25
【问题描述】:
我在壁球俱乐部安装了一个摄像头,希望它告诉我壁球场是有人还是空的。我用几百张被占用和空荡荡的球场图像对其进行了训练,结果很好。
现在的问题是,有时俱乐部会提前关门,而且灯会关掉。所以我基本上有几乎黑色的图像。我尝试将其中一些图像添加到我的“空”壁球场训练集中。我重新运行了图像训练,但新模型并未将这些暗图像预测为空。它认为他们被占用了。
接下来我尝试创建一个名为“court_closed”的新类。我将其中五张深色图像放在那里并重新训练。现在模型认为暗图像是“空的”。从技术上讲,这是对他们被占用的想法的改进。但为什么不将它们预测为“court_closed”?我是否需要添加数百张几乎相同的深色/黑色图像?
这是一个示例图像:
【问题讨论】:
-
我认为您将需要更多“court_closed”图像。我通常会尝试在我的训练数据的每个类别中包含相同数量的图像。
-
我认为这里非常需要一些预处理。 NN 无法从黑色图像中学习任何特征。也许尝试将其转换为 HSV 颜色空间,应用一些 GaussianBlur 和 Binary Threshold。
-
你有在哪里贴出更多代码吗?看看它也可能会有所帮助。
-
谢谢。我会尝试更多的 court_closed 图片。我可以只复制我拥有的五个吗?还是他们需要是独一无二的?它们几乎都是黑色的。
-
@FarazH 检查这个question的答案。
标签: tensorflow computer-vision image-recognition