【问题标题】:Tensorflow for Poets Inception v3 image size用于 Poets Inception v3 图像大小的 TensorFlow
【发布时间】:2025-11-29 02:40:01
【问题描述】:

我正在以 TensorFlow for Poets 为例训练我自己的图像集,

https://codelabs.developers.google.com/codelabs/tensorflow-for-poets/

图片需要多大尺寸。我已经读过该脚本会自动为您调整图像的大小,但是它将它们调整为什么大小。您可以将图像的大小预先调整为此以节省磁盘空间(10,000 个 1mb 图像)。

它如何裁剪图像、截断图像的一部分、添加白/黑条或更改纵横比?

另外,我认为 Inception v3 使用 299x299 的图像,如果您的图像识别需要更详细的精度怎么办,是否可以增加网络图像大小,比如 598x598?

【问题讨论】:

    标签: tensorflow deep-learning conv-neural-network


    【解决方案1】:

    我不知道这个实现使用什么调整大小的选项;如果您在文档中没有找到,那么我希望我们需要阅读代码。

    图片可以是任意大小。是的,您可以缩小图像以节省磁盘空间。但是,请注意您会丢失图像细节;将无法恢复丢失的信息。

    好消息是你不应该需要它; CNN 模型是为包含足够细节来处理手头问题的图像大小而构建的。更大的图像细节通常不会转化为更高的分类精度。将图像分辨率加倍通常会浪费存储空间。

    为此,您必须编辑代码以接受更大的“原生”图像尺寸。然后,您必须更改模型拓扑以考虑更大的输入大小:或者在某处使用更大的降压因子(这可能会破坏更大的分辨率),或者模型上的另一个层来捕获更大的大小。

    要获得更准确的模型,您通常需要更强大的网络拓扑。 2x 分辨率并没有为我们提供更多信息来区分马和校车。

    【讨论】:

    • 谢谢。不过,我并不是想从校车中区分一匹马,而是尝试标记非常详细的皮肤图像,所以细节很重要。 《盗梦空间》是否适用于较大的法师类型,还是只允许 299x299?
    • 不,Inception v3 专门处理这种尺寸。内核(学习过滤器)在每一层中将输入减少了一定的因子。如果更改输入大小,则需要在模型拓扑中的某处进行相应的更改。 更改 (1) 您必须更改输入模块以处理较大的图像。这可以像将“299”的几个实例更改为“598”一样简单。 (2) 您几乎肯定想要添加一个层以提供另一个 2x2 的尺寸减小。否则,在到达最终分类 FC(全连接)层之前,您将拥有 4 倍的模型大小。