【问题标题】:regression on images using keras使用 keras 对图像进行回归
【发布时间】:2018-06-18 13:31:35
【问题描述】:

我想使用图像来预测手、脸和转向的位置。

来源:Kaggle

为此,我手动标记了这个数据集,如下所示

    image   Head_x  Head_y  left_hand_x left_hand_y steering_wheel_x steering_wheel_y   right_hand_x    right_hand_y
    0   img_56.jpg  192 178 461 126 443 219 587 321
    1   img_63.jpg  333 135 636 56  581 171 637 383
    2   img_118.jpg 242 134 539 161 540 240 633 398
    3   img_120.jpg 163 132 479 110 440 213 592 304
    4   img_138.jpg 192 185 514 105 490 213 588 407

我正在使用 kerasRegressor 来训练神经网络模型。神经网络的输入应该是上面的图像和 8 个输出值,即每个位置的 X 和 Y 坐标。但我不知道如何使用这些图像作为输入并训练模型。

estimator = KerasRegressor(build_fn=baseline_model, nb_epoch=10, batch_size=100, verbose=False)
kfold = KFold(n_splits=10, random_state=seed)
results = cross_val_score(estimator, X, y, cv=kfold)

我这样做是为了将输入与输出分开。

X = data["image"].values
data.drop("image",axis=1, inplace=True)
Y = data.values

但显然我需要用图像的内容替换图像的名称。我该怎么做?图像中每个像素的 RGB 值会起作用吗?

【问题讨论】:

    标签: neural-network keras regression kaggle


    【解决方案1】:

    keras 中,您可以加载图片:

    from keras.preprocessing.image import img_to_array, load_img
    
    img_path = 'img_56.jpg'
    img = load_img(img_path)  # this is a PIL image
    x = img_to_array(img)
    

    Source

    这将为您提供一个形状为 (channels, height, width) 的张量,其中对于 RGB 图像,channels 通常是 3

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2018-12-04
      • 2017-10-14
      • 1970-01-01
      • 2019-01-22
      • 1970-01-01
      • 2020-05-16
      • 2017-10-29
      相关资源
      最近更新 更多