【发布时间】:2017-12-17 10:02:19
【问题描述】:
在我看过的所有关于 tensorflow 的教程中,他们都使用了 MNIST 数据集,我已经了解了建模,但是如何将这个数据集加载到 tensorflow 中? https://www.nist.gov/itl/iad/image-group/emnist-dataset
【问题讨论】:
标签: image-processing tensorflow tensorflow-datasets
在我看过的所有关于 tensorflow 的教程中,他们都使用了 MNIST 数据集,我已经了解了建模,但是如何将这个数据集加载到 tensorflow 中? https://www.nist.gov/itl/iad/image-group/emnist-dataset
【问题讨论】:
标签: image-processing tensorflow tensorflow-datasets
EMNIST dataset 使用与原始MNIST dataset 相同的二进制格式。因此,您可以从任何使用原始 MNIST 数据集的教程中获取输入管道代码,并将其指向您从下载 EMNIST 数据集获得的文件集以在该数据集上进行训练。
【讨论】:
您可以使用 scipy.io.loadmat() 加载 Matlab 格式的 EMNIST 数据文件。加载后必须旋转阵列。 GitHub 上有一个 Jupyter Notebook,它是 EMNIST Digits classification。
【讨论】:
您可以使用可在此处找到的 EMNIST 包:https://pypi.org/project/emnist/
要加载数据集,您首先需要确定要使用六个不同数据集中的哪一个。本文详解:https://arxiv.org/pdf/1702.05373v1.pdf
假设我们要使用 byclass 数据集:
from emnist import extract_training_samples, extract_test_samples
x_train, y_train = extract_training_samples('byclass')
x_test, y_test = extract_test_samples('byclass')
【讨论】: