【发布时间】:2018-09-23 11:47:06
【问题描述】:
在使用 GradientBoostingClassifiers 时,我试图获得模型预测的类的概率,我使用“predict_proba(X)”方法。 但我想知道如何检查这个预测的准确性。
P = np.array(D1.drop(['Class'], axis = 1))
q = np.array(D1['Class'])
P_train, P_test, q_train, q_test = train_test_split(P, q)
qst = GradientBoostingClassifier(criterion='friedman_mse', init=None,
learning_rate=0.08, loss='deviance', max_depth=None,
max_features=None, max_leaf_nodes=None,
min_samples_leaf=1,
min_samples_split=2, min_weight_fraction_leaf=0.0,
n_estimators=400, presort='auto', random_state=None,
subsample=0.8, verbose=0, warm_start=False).fit(P_train, q_train)
总数据集为 (17520x24) - 24 个特征,包括“类”特征 上面的代码有3个类
pred_prob_P_test = qst.predict_proba(P_test)
这给出了目标属于每个类别的百分比概率
我想检查这个预测概率的准确性。
【问题讨论】:
-
请给我们您当前的代码
-
@ArtemisFowl,我刚刚用代码和一些 cmets 进行了编辑。
标签: python machine-learning classification prediction gbm