用于 Poets Inception v3 图像大小的 TensorFlow答案

【问题标题】：Tensorflow for Poets Inception v3 image size用于 Poets Inception v3 图像大小的 TensorFlow
【发布时间】：2017-10-12 19:24:34
【问题描述】：

我正在以 TensorFlow for Poets 为例训练我自己的图像集，

图片需要多大尺寸。我已经读过该脚本会自动为您调整图像的大小，但是它将它们调整为什么大小。您可以将图像的大小预先调整为此以节省磁盘空间（10,000 个 1mb 图像）。

它如何裁剪图像、截断图像的一部分、添加白/黑条或更改纵横比？

另外，我认为 Inception v3 使用 299x299 的图像，如果您的图像识别需要更详细的精度怎么办，是否可以增加网络图像大小，比如 598x598？

【问题讨论】：

【解决方案1】：

我不知道这个实现使用什么调整大小的选项；如果您在文档中没有找到，那么我希望我们需要阅读代码。

图片可以是任意大小。是的，您可以缩小图像以节省磁盘空间。但是，请注意您会丢失图像细节；将无法恢复丢失的信息。

好消息是你不应该需要它； CNN 模型是为包含足够细节来处理手头问题的图像大小而构建的。更大的图像细节通常不会转化为更高的分类精度。将图像分辨率加倍通常会浪费存储空间。

为此，您必须编辑代码以接受更大的“原生”图像尺寸。然后，您必须更改模型拓扑以考虑更大的输入大小：或者在某处使用更大的降压因子（这可能会破坏更大的分辨率），或者模型上的另一个层来捕获更大的大小。

要获得更准确的模型，您通常需要更强大的网络拓扑。 2x 分辨率并没有为我们提供更多信息来区分马和校车。

【讨论】：

谢谢。不过，我并不是想从校车中区分一匹马，而是尝试标记非常详细的皮肤图像，所以细节很重要。《盗梦空间》是否适用于较大的法师类型，还是只允许 299x299？
不，Inception v3 专门处理这种尺寸。内核（学习过滤器）在每一层中将输入减少了一定的因子。如果更改输入大小，则需要在模型拓扑中的某处进行相应的更改。更改 (1) 您必须更改输入模块以处理较大的图像。这可以像将“299”的几个实例更改为“598”一样简单。 (2) 您几乎肯定想要添加一个层以提供另一个 2x2 的尺寸减小。否则，在到达最终分类 FC（全连接）层之前，您将拥有 4 倍的模型大小。