【发布时间】:2019-10-25 08:54:41
【问题描述】:
我正在练习一般的计算机视觉,特别是使用 TensorFlow 对象检测 API,我还没有真正理解一些事情。
我正在尝试重新训练 SSD 模型以检测一类自定义对象(吉他)。
我一直在使用 ssd_mobilenet_v1_coco 和 ssd_mobilenet_v2_coco 模型,其中包含从 OpenImage 数据集下载的 1000K 预标记图像的数据集。我用的是标准配置文件,只修改了必要的部分。
我对小物体的检测结果有些不满意,这在使用 SSD 模型时应该是正常的。在 stackoverflow 上,我看到有人建议将图像裁剪为较小的帧,但我无法理解一些事情:
根据 .config 文件和 SSD 论文,图像被调整为 300x300 像素的固定尺寸(我假设它在训练模型和使用它进行推理时都成立)。所以,我想这意味着训练和测试/评估图像的原始大小无关紧要,因为它们总是被调整为 300x300?然后,我不明白为什么很多人建议使用与模型训练过的相同大小的图像......这有关系吗?
首先我并不太清楚“小物体”是什么意思。
是指物体与整个图像之间的尺寸比吗?那么,一个小物体是指一个覆盖......比如说,不到总图像的 5% 的物体?
或者它是指构成该物体的像素数强>?
在第一种情况下,裁剪对象周围的图像是有意义的。在第二种情况下,它应该不起作用,因为识别对象的有用像素的数量保持不变。
谢谢!
【问题讨论】:
标签: python tensorflow object-detection object-detection-api