【发布时间】:2019-06-08 15:19:59
【问题描述】:
通常我们将原始特征和目标数据 (X,y) 拆分为 (X_train, y_train) 和 (X_test, y_test)。
通过使用方法:
mae_A = cross_val_score(clf, X_train_scaled, y_train, scoring="neg_mean_absolute_error", cv=kfold)
我得到了 (X_train, y_train) 的交叉验证平均绝对误差 (MAE),对吧?
那么,我怎样才能获得 (X_test, y_test) 的 MAE(来自之前使用 (X_train, y_train) 得到的交叉验证模型)?
非常感谢!
麦孔·洛伦索
【问题讨论】:
-
通常,您不会分别对训练和测试进行交叉验证。您对整个数据集执行此操作。
-
如果在
cv=kfold而不是kfold中,您使用可迭代的收益率(训练、测试)拆分作为索引数组,您的模型将在训练索引上进行训练并为测试索引生成分数。跨度>
标签: python scikit-learn cross-validation