【发布时间】:2021-04-16 15:30:03
【问题描述】:
给定一个数据集,我想使用逻辑回归来预测一个类(-1 或 +1),我将其拆分如下(在测试集中只预测一个条目):
x_train, x_test = loc_indep[:-1], loc_indep[-1:]
y_train, y_test = loc_target[:-1], loc_target[-1:]
然后我使用以下来训练模型:
regr = LogisticRegression()
regr.fit(x_train, y_train)
predictions = regr.predict(x_test)
probabilities = regr.predict_proba(x_test)
print(probabilities) # prints probabilities
鉴于上述情况,probabilities 总是打印 [1. 0.] 或 [0. 1.],这意味着选择 +1 类或 -1 类的概率为 100%。为什么会这样?我预计概率总和为 1,但模型选择的概率为 54%,例如 +1 类。
【问题讨论】:
标签: python-3.x machine-learning scikit-learn classification logistic-regression