【问题标题】:Resizing big images for object detection调整大图像的大小以进行对象检测
【发布时间】:2020-02-12 15:06:32
【问题描述】:

我需要使用深度学习对“巨大”图像(例如 10000x10000 像素)执行对象检测。

在工作流程的某个时刻,我需要将图像大小调整为更易于管理的尺寸,例如 640x640。目前,我正在使用 opencv 实现这一点:

import cv2
img = cv2.imread("some/path/to/my/img")
h, w = 640, 640
img = cv2.resize("some/path/to/my/img_resized", (w,h)) 

现在,当我尝试用肉眼查看其中一些图片(例如,检查我的边界框是否明确)时,我“什么都看不到”,因为调整大小非常激进图像被严重像素化。

这会对算法的训练造成问题吗?因为最后,我可以通过一些变换将模型输出的边界框恢复为原始图像(100000x10000px)。那不是问题。但我不知道在训练期间处理此类像素化图像是否会导致出现问题?

【问题讨论】:

    标签: deep-learning computer-vision object-detection


    【解决方案1】:

    这真的取决于在调整大小期间丢失了哪些信息。从 10000x10000 到 640x640,我会假设几乎所有相关的东西都丢失了,即使完全可以解决,问题也会变得更加困难。 如果你不能解决问题(看到调整大小的图像中的对象),那么用神经网络解决问题是一个非常糟糕的起点。我仍然会尝试看看网络是否有任何作用。

    它可能不会很好用。尝试解决此问题的一种简单方法是将初始图像拆分为补丁,并对它们进行检测并组合结果。这可以工作,但根据问题可能还不够。

    如果这还不足以解决您的问题,您可能想做一些最先进的研究并尝试找到有类似问题的人。我知道医学图像也可以很大。此外,处理卫星图像的人可能也会遇到输入图像过大的问题,并且可能想出了解决此问题的方法。

    【讨论】:

    • 谢谢。确实,医疗和航空领域是解决此类问题的领域。我确实看到并考​​虑过修补。但正如你所说,这是一个相当研究的领域。
    猜你喜欢
    • 1970-01-01
    • 2021-08-26
    • 2020-11-20
    • 2022-01-23
    • 2019-06-09
    • 2021-09-10
    • 1970-01-01
    • 2011-08-20
    • 2011-06-21
    相关资源
    最近更新 更多