【发布时间】:2020-09-10 22:52:56
【问题描述】:
我正在使用 TensorFlow 2.0.0 并尝试使用 tf.data.Dataset.from_generator() 创建自己的数据集
这是我的代码:
def trainDatagen():
for npy in train_list:
x = tf.convert_to_tensor(np.load(npy), dtype=tf.float32)
if npy in gbmlist:
y = to_categorical(0, num_classes=2)
else:
y = to_categorical(1, num_classes=2)
yield x, y
def tfDatasetGen(datagen, output_types, is_training, batch_size):
dataset = tf.data.Dataset.from_generator(generator=datagen, output_types=output_types)
if is_training:
dataset.shuffle(buffer_size=100)
dataset.repeat()
dataset.batch(batch_size=batch_size)
dataset.prefetch(buffer_size=tf.data.experimental.AUTOTUNE)
return dataset
train_set = tfDatasetGen(
datagen = trainDatagen,
output_types = (tf.float32, tf.float32),
is_training = True,
batch_size = 16)
所有这些 npy 文件都是形状为 [4000,2048] 的 np.array,来自具有 4000 个切片的大型病理幻灯片。 ResNet50计算出每个瓦片的特征。
这是我的模型:
def top_k(inputs, k):
return tf.nn.top_k(inputs, k=k, sorted=True).values
def least_k(inputs, k):
return -tf.nn.top_k(-inputs, k=k, sorted=True).values
def minmax_k(inputs, k):
return tf.concat([top_k(inputs, k), least_k(inputs, k)], axis = -1)
inputs = keras.Input(shape=(4000,2048))
y = layers.Conv1D(1, 2048, use_bias=False, padding='same', data_format='channels_last')(inputs)
y = layers.Flatten()(y)
y = layers.Lambda(minmax_k, arguments={'k': 5})(y)
y = layers.Dense(units=200, activation=tf.nn.relu)(y)
y = layers.Dropout(rate=0.5)(y)
y = layers.Dense(units=100, activation=tf.nn.relu)(y)
y = layers.Dense(units=2, activation=tf.nn.softmax)(y)
model = keras.Model(inputs=inputs, outputs=y)
当使用 model.fit() 训练模型时,我收到了这个:
ValueError: Error when checking input: expected input_4 to have 3 dimensions, but got array with shape (4000, 2048)
所有这些想法都来自论文 arXiv:1802.02212。这是我试图重现的神经网络图。
我按照 Mahsa Hassankashi 的建议将输入重塑为 (4000,2048,1)
x = tf.convert_to_tensor(np.load(npy).reshape(4000,2048,1), dtype=tf.float32)
并根据GitHub问题修改了这部分以修复错误:
train_set = tfDatasetGen(
datagen = trainDatagen,
output_types = (tf.float32, tf.float32),
**output_shapes = (tf.TensorShape((None,None,None)), tf.TensorShape((2,))),**
is_training = True,
batch_size = 16)
但我得到了这个:
InvalidArgumentError: input and filter must have the same depth: 1 vs 2048
最后我尝试将输入重塑为(1,4000,2048),这一次又出现了另一种错误:
InvalidArgumentError: Expected size[0] in [0, 1], but got 2
【问题讨论】:
标签: python tensorflow keras deep-learning neural-network