如何将图像输入 CNN答案

【问题标题】：How to feed images into a CNN如何将图像输入 CNN
【发布时间】：2021-02-17 15:48:30
【问题描述】：

我是 tensorflow 的新手，正在尝试创建一个用于二进制分类的卷积神经网络，以区分正常人脸和中风人脸之间的差异。

我的数据集的图像包含在一个名为 CNNImages 的目录中，并包含两个子目录：RegularFaces 和 Strokes。在每个子目录中都是我尝试输入神经网络的 PNG 图像。

按照此参考中建议的方法：https://towardsdatascience.com/build-your-own-convolution-neural-network-in-5-mins-4217c2cf964f，我已经成功地使用 Spyder 创建了神经网络本身，它在使用 mnist.load_data() 运行时可以工作。

但是，我在使用 tf.data.Dataset 将自己的图像上传到神经网络时遇到了问题。当我尝试在我创建的图像数据库上训练我的神经网络时，它返回一个 ValueError 并指出“要解包的值太多（预期为 2）”。我相信我要么错误地调用了我的数据库，要么在创建数据库时搞砸了。

import tensorflow as tf
import os
import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten
from keras.layers import Conv2D, MaxPooling2D
import numpy as np

os.chdir("/Users/Colin/CNNImages")

files = tf.data.Dataset.list_files("/Users/Colin/CNNImages/*/*.png")

def load_images(path):
    image = tf.io.read_file(path)
    image = tf.io.decode_jpeg(image)
    image = tf.image.convert_image_dtype(image, tf.float32)
    image = tf.image.resize(image, (128, 128))

    parts = tf.strings.split(path, os.path.sep)
    bool_values = tf.equal(parts[-2], 'strokes')
    indices = tf.cast(bool_values, tf.int32)
    return image, indices

ds = files.map(load_images).batch(1)

next(iter(ds))

"""
Above: Image Formatter
Below: CNN
"""


batch_size = 128
num_classes = 2
epochs = 12

# input image dimensions
img_rows, img_cols = 128, 128

# the data, split between train and test sets
(x_train, y_train), (x_test, y_test) = ds

x_train = x_train.reshape(869,128,128,3)
x_test = x_test.reshape(217,128,128,3)

print('x_train shape:', x_train.shape)
print(x_train.shape[0], 'train samples')
print(x_test.shape[0], 'test samples')

# convert class vectors to binary class matrices
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3),
                 activation='relu',
                 input_shape=(28,28,1)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(num_classes, activation='softmax'))

model.compile(loss=keras.losses.categorical_crossentropy,
              optimizer=keras.optimizers.Adadelta(),
              metrics=['accuracy'])

model.fit(x_train, y_train,
          batch_size=batch_size,
          epochs=epochs,
          verbose=1,
          validation_data=(x_test, y_test))
score = model.evaluate(x_test, y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])

当我为 (x_train, y_train), (x_test, y_test) = ds 调用 ds 时，我收到 ValueError，它指出“要解包的值太多（预期为 2）”。我把那条线弄乱了吗？还是我的 tf 数据集设计不当？

【问题讨论】：

标签： python tensorflow keras conv-neural-network tf.data.dataset

【解决方案1】：

tf.data.Dataset 的每个元素都是一个元组 (img,label)。如果要创建验证拆分，则应使用 take 和 skip 来创建它。您也不能像稍后在脚本中那样对Dataset 进行整形和应用函数。

要在数据集上创建训练/验证拆分，请使用 skip 和 take：

# number of element in the validation dataset
n_elem_validation_ds = 267 
val_ds = ds.take(n_elem_validation_ds)
train_ds = ds.skip(n_elem_validation_ds)

要将函数应用于您的数据集，请使用map：

# convert class vectors to binary class matrices
helper_categorical = lambda x: keras.utils.to_categorical(x, num_classes)
ds = ds.map(lambda img, label: (img, helper_categorical(label)))

注意：您可以跳过 keras.utils.to_categorical( 函数并使用 sparse_categorical_crossentropy 作为损失函数。

要在数据集上拟合您的模型，只需将 tf.data.Dataset 传递给 fit 函数：

model.fit(train_ds, validation_data=val_ds)

要进一步了解，您应该阅读以下指南：tf.data: Build TensorFlow input pipelines。

【讨论】：

当我将行 helper_categorical = lambda x: keras.utils.to_categorical(x, num_classes) 添加到我的代码中时，会出现以下错误：“TypeError: __array__() 采用 1 个位置参数，但给出了 2 个”。要修复此错误，我是否只需将(x, num_classes) 更改为(num_classes)？我尝试这样做，但收到以下错误：“ValueError: too many values to unpack (expected 2)”。