【发布时间】:2017-03-26 00:28:45
【问题描述】:
我正在尝试解析此文件 http://www4.stat.ncsu.edu/~boos/var.select/diabetes.rwrite1.txt 以运行多特征回归,但我收到“ValueError: Found array with dim 3. Estimator expected
database = open(r'diabetes.rwrite1.txt','r').readlines()[1:]
lstx = []
lsty = []
for line in database:
splitted = line.split()
lstx.append(splitted[0:9])
lsty.append(float(splitted[10]))
x_ = np.array(lstx)[:, np.newaxis, 1:9]
x = x_.astype(float)
y = np.array(lsty)
lr = LinearRegression()
lr.fit(x, y)
【问题讨论】:
-
打印出 x 和 y 的形状,并与 scikit-learn 的规则进行比较。 (如果需要和可能,非浮点数将被转换为浮点数)。我还建议使用 numpy 或 pandas 来执行 read-csv 部分。
标签: python numpy scikit-learn