【发布时间】:2018-04-12 10:59:39
【问题描述】:
这是 YOLO 的架构。我正在尝试自己计算每一层的输出大小,但我无法获得论文中描述的大小。
例如,在第一个 Conv 层中,输入大小为 448x448,但它使用步长为 2 的 7x7 滤波器,但根据这个方程 W2=(W1−F+2P)/S+1 = ( 448 - 7 + 0)/2 + 1,我无法得到整数结果,所以过滤器大小似乎不适合输入大小。
那么任何人都可以解释这个问题吗?我是否遗漏了什么或误解了 YOLO 架构?
【问题讨论】:
-
你在说什么纸?至少提供一个链接。你对 YOLO 架构有误解吗?你是怎么理解的?
-
@Piglet 论文是arxiv.org/abs/1506.02640
-
我会使用一个框架来为你做这个计算,例如 Keras。
标签: machine-learning computer-vision computer-science yolo convolutional-neural-network