【发布时间】:2019-01-15 04:53:14
【问题描述】:
为了理解这个概念,我阅读了Mauricio Menegaz 写的这篇文章,并在 YouTube 上观看了 Deeplearning.ai 的 video,但我对 S x S x (B * 5 +C) 感到困惑) 部分。我知道 S x S 代表网格大小,5 代表边界框的组件,C 代表类。 B 和锚盒一样吗?如果我只想检测一个类别(例如车牌),那是否意味着只有 1 个 B?
编辑 在将图像输入神经网络之前,是否在图像上创建了边界框?
【问题讨论】:
标签: machine-learning computer-vision yolo