【问题标题】:Sklearn regression input "Found array with dim 3. Estimator expected <= 2"Sklearn回归输入“找到暗淡3的数组。估计器预期<= 2”
【发布时间】:2017-03-26 00:28:45
【问题描述】:

我正在尝试解析此文件 http://www4.stat.ncsu.edu/~boos/var.select/diabetes.rwrite1.txt 以运行多特征回归,但我收到“ValueError: Found array with dim 3. Estimator expected

database = open(r'diabetes.rwrite1.txt','r').readlines()[1:]
lstx = []
lsty = []
for line in database:
    splitted = line.split()
    lstx.append(splitted[0:9])
    lsty.append(float(splitted[10]))


x_ = np.array(lstx)[:, np.newaxis, 1:9]
x = x_.astype(float)
y = np.array(lsty) 
lr = LinearRegression()
lr.fit(x, y)

【问题讨论】:

  • 打印出 x 和 y 的形状,并与 scikit-learn 的规则进行比较。 (如果需要和可能,非浮点数将被转换为浮点数)。我还建议使用 numpy 或 pandas 来执行 read-csv 部分。

标签: python numpy scikit-learn


【解决方案1】:

如果要预测连续变量,请使用线性回归。如果要预测类别,则需要使用 LogisticRegression 或 RandomForestClassifier 等分类器。

在 sklearn 中,这些名称中几乎总是包含“分类器”。

【讨论】:

    猜你喜欢
    • 2016-04-30
    • 2020-07-10
    • 2019-06-01
    • 2018-01-16
    • 2018-06-08
    • 2016-04-24
    • 2016-11-28
    • 2020-07-05
    • 2021-04-16
    相关资源
    最近更新 更多