【问题标题】:different Image sizes(resolution) as input for inference on CNN不同的图像尺寸(分辨率)作为 CNN 推理的输入
【发布时间】:2019-06-28 14:20:03
【问题描述】:

这可能是一个基本的概念性问题,但是阅读不同的 CNN,例如 VGG、Alexnet、GoogleNet 等,似乎一旦模型已经在特定图像尺寸作为输入(比如说 256x256)上进行了训练,我就可以了t 在推理期间为模型提供不同的图像大小 (1,920 x 1,080),无需调整大小或裁剪。这是真的吗?

我知道 YOLO 处理不同分辨率的图像,Yolo 是否在将图像提供给卷积层之前调整图像大小?

我的要求是对可能具有不同图像大小的一系列图像进行对象识别,显而易见的方法是调整图像大小,但这可能会导致图像信息丢失。

如果是这样,我是否需要为我拥有的每个图像大小训练一个模型,然后每次都为该特定图像重新加载模型?

【问题讨论】:

  • 您不需要为每个图像尺寸训练模型。 Yolo 确实会调整输入图像的大小,但这一步与裁剪图像不同,不会导致任何信息丢失。一切都是按比例缩放的,因此调整大小和规范化不会损害性能,即使没有帮助。

标签: neural-network conv-neural-network


【解决方案1】:

概念问题比较多,VGG、AlexNet、GoogleNet是图像分类模型,而YOLO是物体检测模型。只有当网络是完全卷积的,它才能接受可变大小的图像。

因此,您唯一的选择是将图像大小调整为通用尺寸,这在实践中效果很好,因此您应该这样做并评估不同的图像尺寸,以查看准确性如何随它而变化。只有做完这样的实验,你才能决定调整大小是否合适。

【讨论】:

  • 非常感谢,所以据我所知,如果我想要可变大小的图像,我不能在最后拥有完全连接的层。那么有没有用于图像分类的完全卷积网络?我知道Yolo是一个完全卷积的物体检测模型,但它不是也对每个物体做分类吗?
猜你喜欢
  • 2013-03-17
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-01-04
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2014-10-31
相关资源
最近更新 更多