使用 keras 对图像进行回归答案

【问题标题】：regression on images using keras使用 keras 对图像进行回归
【发布时间】：2018-06-18 13:31:35
【问题描述】：

我想使用图像来预测手、脸和转向的位置。

来源：Kaggle

为此，我手动标记了这个数据集，如下所示

    image   Head_x  Head_y  left_hand_x left_hand_y steering_wheel_x steering_wheel_y   right_hand_x    right_hand_y
    0   img_56.jpg  192 178 461 126 443 219 587 321
    1   img_63.jpg  333 135 636 56  581 171 637 383
    2   img_118.jpg 242 134 539 161 540 240 633 398
    3   img_120.jpg 163 132 479 110 440 213 592 304
    4   img_138.jpg 192 185 514 105 490 213 588 407

我正在使用 kerasRegressor 来训练神经网络模型。神经网络的输入应该是上面的图像和 8 个输出值，即每个位置的 X 和 Y 坐标。但我不知道如何使用这些图像作为输入并训练模型。

estimator = KerasRegressor(build_fn=baseline_model, nb_epoch=10, batch_size=100, verbose=False)
kfold = KFold(n_splits=10, random_state=seed)
results = cross_val_score(estimator, X, y, cv=kfold)

我这样做是为了将输入与输出分开。

X = data["image"].values
data.drop("image",axis=1, inplace=True)
Y = data.values

但显然我需要用图像的内容替换图像的名称。我该怎么做？图像中每个像素的 RGB 值会起作用吗？

【问题讨论】：

标签： neural-network keras regression kaggle

【解决方案1】：

在keras 中，您可以加载图片：

from keras.preprocessing.image import img_to_array, load_img

img_path = 'img_56.jpg'
img = load_img(img_path)  # this is a PIL image
x = img_to_array(img)

Source

这将为您提供一个形状为 (channels, height, width) 的张量，其中对于 RGB 图像，channels 通常是 3。

【讨论】：