【问题标题】:TensorFlow Dataset train/test splitTensorFlow 数据集训练/测试拆分
【发布时间】:2020-12-21 10:14:01
【问题描述】:

我正在尝试从 TensorFlow Datasets 加载 coil100 数据集。根据文档,此数据集仅与 train 拆分一起提供。我想在训练/测试中拆分数据集以便在本地播放,但是,即使在仔细阅读了 TensorFlow 数据集文档之后,我还是有很多问题。这是我的尝试:

import tensorflow_datasets as tfds

ds_train, ds_info = tfds.load(
'coil100',
split=['train'],
shuffle_files=True,
as_supervised=True,
with_info=True,

)

train = ds_train[0][0: 7000]
test = ds_train[0][7000:]

但是,它会导致这个错误:

TypeError: '_OptionsDataset' object is not subscriptable

我在理解一些数据集的准备方式时遇到了很多问题,因为返回的数据是不可迭代的,而这一切在文档中并没有真正清楚地解释。是否有任何其他资源可以让我最终了解如何处理该库中的任何数据集?

【问题讨论】:

    标签: python tensorflow keras tensorflow2.0 tensorflow-datasets


    【解决方案1】:

    参见Tensorflow Datasets: Splits and Slicing 的文档。你需要的是这样的:

    tfds.load('coil100', split=['train[:7000]', 'train[7000:]'])
    

    【讨论】: