【发布时间】:2019-04-23 15:58:00
【问题描述】:
我目前正在执行分类,但我的分类器无法预测测试集上的正分类。
正负分布是 10:90。我使用分层抽样进行了 5 折交叉验证,结果似乎在所有折叠中都是连续的,而在测试中它预测所有类都是阳性的。
from xgboost.sklearn import XGBClassifier
scores =[]
clf1 = XGBClassifier()
clf1.fit(X,y)
scores = cross_val_score(clf1, X, y, cv=skf.split(X, y), scoring='roc_auc')
print(scores.mean())
scores
同样的输出是
0.6286471235534742
array([0.62958638, 0.63038406, 0.6277138 , 0.63027538, 0.62527601])
我已将分类数据视为热编码。测试班分布为 14:86。它将所有类预测为负数。
我的训练数据集大小是 75002,44。
【问题讨论】: