【发布时间】:2018-05-20 21:17:59
【问题描述】:
我正在使用 sklearn 的 cross_val_predict 进行如下训练:
myprobs_train = cross_val_predict(LogisticRegression(),X = x_old, y=y_old, method='predict_proba', cv=10)
我对返回的概率很满意,现在想对一个全新的数据集进行评分。我试过了:
myprobs_test = cross_val_predict(LogisticRegression(), X =x_new, y= None, method='predict_proba',cv=10)
但这不起作用,它抱怨 y 的形状为零。这是否意味着无法将 cross_val_predict 中经过训练和交叉验证的模型应用于新数据?还是我用错了?
谢谢!
【问题讨论】:
-
是的,它出错并不奇怪,因为您在第二次运行中没有包含任何 y 值。你想做一些样本外的预测吗? cross_val_predict 可能不是最好的,因为它不允许您分两步进行拟合和预测
标签: scikit-learn