【发布时间】:2017-02-18 05:45:19
【问题描述】:
我是 tensorflow 的新手,我从官方的 MNIST 示例代码开始学习 tensorflow 的逻辑。但是,我觉得不好的一点是,MNIST 示例提供了原始数据集作为一些压缩文件,其格式对初学者来说并不清晰。这种情况也适用于以二进制文件形式提供数据集的 Cifar10。我认为在实际的深度学习任务中,我们的数据集可能是很多图像文件,例如一个目录中的*.jpg 或*.png,我们还有一个记录每个文件标签的文本文件(如 ImageNet 数据集)。让我以 MNIST 为例。
MNIST 包含 50k 个大小为 28 x 28 的训练图像。现在让我们假设这些图像是 jpg 格式,并存储在目录./dataset/ 中。在./dataset/,我们有一个文本文件label.txt存储每张图片的标签:
/path/to/dataset/
image00001.jpg
image00002.jpg
... ... ... ...
image50000.jpg
label.txt
label.txt 是这样的:
#label.txt:
image00001.jpg 1
image00002.jpg 0
image00003.jpg 4
image00004.jpg 9
... ... ... ...
image50000.jpg 3
现在我想用 Tensorflow 用这些数据集训练一个单层模型。谁能帮忙提供一个简单的代码 sn-p 来做到这一点?
【问题讨论】:
标签: python tensorflow