不同的图像尺寸（分辨率）作为 CNN 推理的输入答案

【问题标题】：different Image sizes(resolution) as input for inference on CNN不同的图像尺寸（分辨率）作为 CNN 推理的输入
【发布时间】：2019-06-28 14:20:03
【问题描述】：

这可能是一个基本的概念性问题，但是阅读不同的 CNN，例如 VGG、Alexnet、GoogleNet 等，似乎一旦模型已经在特定图像尺寸作为输入（比如说 256x256）上进行了训练，我就可以了t 在推理期间为模型提供不同的图像大小 (1,920 x 1,080)，无需调整大小或裁剪。这是真的吗？

我知道 YOLO 处理不同分辨率的图像，Yolo 是否在将图像提供给卷积层之前调整图像大小？

我的要求是对可能具有不同图像大小的一系列图像进行对象识别，显而易见的方法是调整图像大小，但这可能会导致图像信息丢失。

如果是这样，我是否需要为我拥有的每个图像大小训练一个模型，然后每次都为该特定图像重新加载模型？

【问题讨论】：

您不需要为每个图像尺寸训练模型。 Yolo 确实会调整输入图像的大小，但这一步与裁剪图像不同，不会导致任何信息丢失。一切都是按比例缩放的，因此调整大小和规范化不会损害性能，即使没有帮助。

标签： neural-network conv-neural-network

【解决方案1】：

概念问题比较多，VGG、AlexNet、GoogleNet是图像分类模型，而YOLO是物体检测模型。只有当网络是完全卷积的，它才能接受可变大小的图像。

因此，您唯一的选择是将图像大小调整为通用尺寸，这在实践中效果很好，因此您应该这样做并评估不同的图像尺寸，以查看准确性如何随它而变化。只有做完这样的实验，你才能决定调整大小是否合适。

【讨论】：

非常感谢，所以据我所知，如果我想要可变大小的图像，我不能在最后拥有完全连接的层。那么有没有用于图像分类的完全卷积网络？我知道Yolo是一个完全卷积的物体检测模型，但它不是也对每个物体做分类吗？