【问题标题】:feed picture to model tensorflow for training将图片输入到模型 tensorflow 以进行训练
【发布时间】:2016-12-12 23:55:29
【问题描述】:

我正在尝试将图片导入我的模型进行训练,就像示例“image_retraining”一样​​: https://github.com/tensorflow/tensorflow/tree/master/tensorflow/examples/image_retraining 但是导入过程图像在 classify_image_graph_def.pb 所以我不知道它是如何工作的

我找到了这些方法:
Tensorflow multithreading image loading

https://stackoverflow.com/a/36947632/7040568

https://github.com/samjabrahams/tensorflow-workshop/blob/master/04%20Feedforward%20Network.ipynb

你介意告诉我 tensorflow 为训练模型导入图片的标准方式是什么? 我还没用过tf.train.batchtf.train.Coordinatortf.train.start_queue_runners

我真的很困惑,因为我还在学习如何使用 tensorflow,所以我只需要一个简单或标准的方法

谢谢你和问候,

【问题讨论】:

    标签: python tensorflow


    【解决方案1】:

    一种方法是使用 PIL 或 OpenCV 自己加载它们,例如cv2.imread(filename.png),然后将它们作为维度为 [number of images (batch size), height, width, channels (3 if RGB)] 的数组提供给您的图表(在 feed_dict 中)。

    【讨论】:

    • 我不确定 - 它运行了吗?
    • image_data = ndimage.imread(image_file).astype(float) image_data = (image_data - 255/ 2) / (255/ 2) 对吗?
    • 是的,但我不确定 image_data = (image_data - 255/ 2) / (255/ 2)
    • 这样从图像中减去 127.5,然后除以 127.5。我想这会将你的图像设置在 -1 和 1 之间。我想我已经读过这样的“白化”你的数据是个好主意。您可能想要减去数据(或每个通道或其他东西)的实际平均值,然后除以最大值。我不知道什么是最好的。
    • 你知道任何使用神经网络的 OCR 架构或模型吗?我的意思是我想识别每个字母和数字(0-9,a-z),但我总是找到 mnist 数字的结果。另一个问题:tf.decode_jpg和ndimage.imread的返回是一样的吧?
    猜你喜欢
    • 1970-01-01
    • 2018-02-27
    • 2017-08-21
    • 1970-01-01
    • 1970-01-01
    • 2020-08-13
    • 2022-01-20
    • 2017-07-12
    • 1970-01-01
    相关资源
    最近更新 更多