【发布时间】:2020-07-14 00:38:34
【问题描述】:
我正在尝试对 Kaggle 的数字识别 dataset 实施逻辑回归。训练集中有 42000 行,我想使用数据增强来增加计数。
我尝试使用 keras 的 ImageDataGenerator 对象
datagen = ImageDataGenerator(
rotation_range=30,
zoom_range = 0.2,
width_shift_range=0.2,
height_shift_range=0.2)
datagen.fit(X_train)
但大小保持不变,后来我发现ImageDataGenerator 实际上并没有添加行,而是在训练期间插入了增强数据。
有没有其他工具可以保存或增加相同标签的数据?
【问题讨论】:
-
大小保持不变是什么意思?你能展示你的完整代码吗?您可能对this 感兴趣。
-
数据集形状最初是 (42000, 784),运行上述脚本后,它保持不变。我认为它会像 (168000, 784) 一样增长 4 倍,我读到 keras 在训练时会实时创建数据
-
它保持不变,除非您选择将增强保存在其他地方。但是,我不确定它是否适用于 CSV 数据(请参阅上面的链接)。
-
@NelsonGon,是的,我确实将 csv 行重塑为形状为 (-1, 28, 28, 1) 的 4D 数组,并且该函数运行时没有任何错误,所以我能够将增强数据与标签一起保存?那太好了
-
@NelsonGon,感谢您的输入,我能够将增强数据保存到数组中,一旦我用标签保存它们,我会尽快发布答案
标签: python tensorflow keras