将图片输入到模型 tensorflow 以进行训练答案

【问题标题】：feed picture to model tensorflow for training将图片输入到模型 tensorflow 以进行训练
【发布时间】：2016-12-12 23:55:29
【问题描述】：

我正在尝试将图片导入我的模型进行训练，就像示例“image_retraining”一样： https://github.com/tensorflow/tensorflow/tree/master/tensorflow/examples/image_retraining 但是导入过程图像在 classify_image_graph_def.pb 所以我不知道它是如何工作的

我找到了这些方法：
Tensorflow multithreading image loading

https://stackoverflow.com/a/36947632/7040568

https://github.com/samjabrahams/tensorflow-workshop/blob/master/04%20Feedforward%20Network.ipynb

你介意告诉我 tensorflow 为训练模型导入图片的标准方式是什么？我还没用过tf.train.batch、tf.train.Coordinator和tf.train.start_queue_runners。

我真的很困惑，因为我还在学习如何使用 tensorflow，所以我只需要一个简单或标准的方法

谢谢你和问候，

【问题讨论】：

标签： python tensorflow

【解决方案1】：

一种方法是使用 PIL 或 OpenCV 自己加载它们，例如cv2.imread(filename.png)，然后将它们作为维度为 [number of images (batch size), height, width, channels (3 if RGB)] 的数组提供给您的图表（在 feed_dict 中）。

【讨论】：

我不确定 - 它运行了吗？
image_data = ndimage.imread(image_file).astype(float) image_data = (image_data - 255/ 2) / (255/ 2) 对吗？
是的，但我不确定 image_data = (image_data - 255/ 2) / (255/ 2)
这样从图像中减去 127.5，然后除以 127.5。我想这会将你的图像设置在 -1 和 1 之间。我想我已经读过这样的“白化”你的数据是个好主意。您可能想要减去数据（或每个通道或其他东西）的实际平均值，然后除以最大值。我不知道什么是最好的。
你知道任何使用神经网络的 OCR 架构或模型吗？我的意思是我想识别每个字母和数字（0-9，a-z），但我总是找到 mnist 数字的结果。另一个问题：tf.decode_jpg和ndimage.imread的返回是一样的吧？