调整大图像的大小以进行对象检测答案

【问题标题】：Resizing big images for object detection调整大图像的大小以进行对象检测
【发布时间】：2020-02-12 15:06:32
【问题描述】：

我需要使用深度学习对“巨大”图像（例如 10000x10000 像素）执行对象检测。

在工作流程的某个时刻，我需要将图像大小调整为更易于管理的尺寸，例如 640x640。目前，我正在使用 opencv 实现这一点：

import cv2
img = cv2.imread("some/path/to/my/img")
h, w = 640, 640
img = cv2.resize("some/path/to/my/img_resized", (w,h))

现在，当我尝试用肉眼查看其中一些图片（例如，检查我的边界框是否明确）时，我“什么都看不到”，因为调整大小非常激进图像被严重像素化。

这会对算法的训练造成问题吗？因为最后，我可以通过一些变换将模型输出的边界框恢复为原始图像（100000x10000px）。那不是问题。但我不知道在训练期间处理此类像素化图像是否会导致出现问题？

【问题讨论】：

【解决方案1】：

这真的取决于在调整大小期间丢失了哪些信息。从 10000x10000 到 640x640，我会假设几乎所有相关的东西都丢失了，即使完全可以解决，问题也会变得更加困难。如果你不能解决问题（看到调整大小的图像中的对象），那么用神经网络解决问题是一个非常糟糕的起点。我仍然会尝试看看网络是否有任何作用。

它可能不会很好用。尝试解决此问题的一种简单方法是将初始图像拆分为补丁，并对它们进行检测并组合结果。这可以工作，但根据问题可能还不够。

如果这还不足以解决您的问题，您可能想做一些最先进的研究并尝试找到有类似问题的人。我知道医学图像也可以很大。此外，处理卫星图像的人可能也会遇到输入图像过大的问题，并且可能想出了解决此问题的方法。

【讨论】：