【发布时间】:2019-07-30 14:38:06
【问题描述】:
我刚开始接触 CNN 和计算机视觉,所以我开始研究对象检测算法,我已经阅读了 Yolov1 的论文,我正在尝试使用从头开始实现代码tensorflow(我知道这会很困难,但我觉得我可以通过这种方式学到更多东西),但是我对训练数据格式有疑问。
根据 YOLOv1,如果我想识别 3 个图像,标签应该是这样的:
[Objectness,x,y,W,H,c1,c2,c3]
其中 c1、c2、c3 表示类的数量,在本例中为 3(例如人类、自行车、汽车) 和 Objectness 表示有对象的置信度1 如果有对象,0 表示没有对象。 .
使用上面的图像作为参考,我是否需要为这个特定的图像标记所有 空单元格?
1st cell, there is no object here = [0,?,?,?,?,?,?,?]
2nd cell, there is no object here = [0,?,?,?,?,?,?,?]
3rd cell, there is no object here = [0,?,?,?,?,?,?,?]
4th cell, there is a black car here = [1,x,y,W,G,0,0,1]
5th cell, there is no object here = [0,?,?,?,?,?,?,?]
6th cell, there is a silver car here = [1,x,y,W,G,0,0,1]
7th cell, there is no object here = [0,?,?,?,?,?,?,?]
8th cell, there is no object here = [0,?,?,?,?,?,?,?]
9th cell, there is no object here = [0,?,?,?,?,?,?,?]
或者只是包含对象的 2 个标签
4th cell, there is a black car here = [1,x,y,W,G,0,0,1]
6th cell, there is a silver car here = [1,x,y,W,G,0,0,1]
【问题讨论】:
标签: tensorflow neural-network conv-neural-network yolo