【发布时间】:2016-12-31 02:17:43
【问题描述】:
在 Windows 上使用 Python 2.7。想要使用特征 T1 和 T2 拟合逻辑回归模型来解决分类问题,目标是 T3。
我显示了T1 和T2 的值以及我的代码。问题是,既然T1 的维度是 5,T2 的维度是 1,我们应该如何对它们进行预处理,以便 scikit-learn 逻辑回归训练正确地利用它们?
顺便说一句,我的意思是对于训练样本 1,它的特征 T1 是 [ 0 -1 -2 -3],而 T2 的特征是 [0],对于训练样本 2,它的特征 T1 是 [ 1 0 -1 -2] 和特征T2 是 [1],...
import numpy as np
from sklearn import linear_model, datasets
arc = lambda r,c: r-c
T1 = np.array([[arc(r,c) for c in xrange(4)] for r in xrange(5)])
print T1
print type(T1)
T2 = np.array([[arc(r,c) for c in xrange(1)] for r in xrange(5)])
print T2
print type(T2)
T3 = np.array([0,0,1,1,1])
logreg = linear_model.LogisticRegression(C=1e5)
# we create an instance of Neighbours Classifier and fit the data.
# using T1 and T2 as features, and T3 as target
logreg.fit(T1+T2, T3)
T1,
[[ 0 -1 -2 -3]
[ 1 0 -1 -2]
[ 2 1 0 -1]
[ 3 2 1 0]
[ 4 3 2 1]]
T2,
[[0]
[1]
[2]
[3]
[4]]
【问题讨论】:
标签: python python-2.7 machine-learning scikit-learn logistic-regression