【问题标题】:Prediction based on multiple binary inputs基于多个二进制输入的预测
【发布时间】:2018-05-25 03:29:48
【问题描述】:

假设我们有以下 DataFrame,其中 A、B、C 和 D 是分类任务的二进制结果。 “1”表示“完成”,“0”表示“未完成”。

A B C D True
0 1 1 1 1
1 0 0 0 0
1 1 1 1 1
1 1 1 1 1
0 1 1 1 1
0 0 0 0 0 
1 1 1 1 1
0 1 0 0 1
0 1 1 1 1
1 1 1 1 1
0 1 0 0 0

我想知道根据A, B, C, D 中的值来预测True 结果的可能性有多大。

我应该使用scikit learn 应用多元逻辑回归吗?

【问题讨论】:

  • 不是一个真正的问题
  • 但是交叉验证了吗?

标签: python scikit-learn classification logistic-regression


【解决方案1】:

你可以使用sklearn's LogisticRegression:

from sklearn.linear_model import LogisticRegression

endog = data.TRUE.values
exog = data.drop('TRUE', axis=1).values
model = LogisticRegression()
model.fit(exog, endog)

model.score(exog, endog)  # mean accuracy
# 0.90909090909090906

model.predict(exog)       # your predicted values
# array([1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1], dtype=int64)

请记住,在此示例中,您正在训练一个统计模型,然后尝试根据您已经提供给该模型的(样本内)数据进行预测。 这通常被认为是破旧的统计做法,因此请谨慎行事或对样本外数据进行测试。

【讨论】:

猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2019-12-27
  • 1970-01-01
  • 1970-01-01
  • 2018-12-26
  • 2023-03-29
  • 2021-09-15
  • 2018-04-09
相关资源
最近更新 更多