【发布时间】:2018-06-18 13:31:35
【问题描述】:
我想使用图像来预测手、脸和转向的位置。
来源:Kaggle
为此,我手动标记了这个数据集,如下所示
image Head_x Head_y left_hand_x left_hand_y steering_wheel_x steering_wheel_y right_hand_x right_hand_y
0 img_56.jpg 192 178 461 126 443 219 587 321
1 img_63.jpg 333 135 636 56 581 171 637 383
2 img_118.jpg 242 134 539 161 540 240 633 398
3 img_120.jpg 163 132 479 110 440 213 592 304
4 img_138.jpg 192 185 514 105 490 213 588 407
我正在使用 kerasRegressor 来训练神经网络模型。神经网络的输入应该是上面的图像和 8 个输出值,即每个位置的 X 和 Y 坐标。但我不知道如何使用这些图像作为输入并训练模型。
estimator = KerasRegressor(build_fn=baseline_model, nb_epoch=10, batch_size=100, verbose=False)
kfold = KFold(n_splits=10, random_state=seed)
results = cross_val_score(estimator, X, y, cv=kfold)
我这样做是为了将输入与输出分开。
X = data["image"].values
data.drop("image",axis=1, inplace=True)
Y = data.values
但显然我需要用图像的内容替换图像的名称。我该怎么做?图像中每个像素的 RGB 值会起作用吗?
【问题讨论】:
标签: neural-network keras regression kaggle