【发布时间】:2017-01-07 03:56:03
【问题描述】:
我有一个这样的 testDF 并尝试进行二进制分类 [0;1]:
我还有一个结构相同的 trainDF,其中填充了错误值,用于训练目的。
我从 trainDF 制作目标和训练集:
target = trainDF.bad.values
train = trainDF.drop('bad', axis=1).values
然后我附加逻辑回归模型并进行交叉验证:
model=[]
model.append (linear_model.LogisticRegression(C=1e5))
TRNtrain, TRNtest, TARtrain, TARtest = train_test_split(train, target,test_size=0.3, random_state=0)
然后适应验证并进行预测:
model.fit(TRNtrain, TARtrain)
pred_scr = model.predict_proba(TRNtest)[:, 1]
然后拟合整个集合并预测坏值:
model.fit(train, target)
test = testDF.drop('bad', axis=1).values
testDF.bad=model.predict(test)
我的问题:如何在附加列中添加坏值 = 1 的逻辑回归概率?我应该采取什么措施?
任何帮助将不胜感激!
【问题讨论】:
标签: python pandas scikit-learn logistic-regression prediction