【发布时间】:2020-08-03 17:01:11
【问题描述】:
我正在练习简单的回归模型作为机器学习的介绍。我已经回顾了一些多元回归的样本模型,我相信这是线性回归的扩展,但具有超过 1 个特征。从我看到的示例中,线性回归和多元回归的语法是相同的。运行以下代码时出现此错误:
ValueError: x and y must be the same size.
为什么会出现此错误,我该如何解决?
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
df = pd.read_csv(r"C:\Users\****\Desktop\data.csv")
#x.shape =(20640, 2), y=(20640,)
X = df[['total_rooms', 'median_income']]
y = df['median_house_value']
X_test, y_test, X_train, y_train = train_test_split(X, y, test_size=.2, random_state=0)
reg = LinearRegression()
reg.fit(X_train, y_train)
我错过了一步吗?感谢您的宝贵时间。
【问题讨论】:
-
那么,我应该猜你是托马斯品钦的粉丝吗? :)
-
我是。希望尽快出最终小说。
-
酷。答案是否解决了您的问题?
-
我相信是这样,但我需要做一些数据清理,这可能是我最初的问题。谢谢。
标签: python scikit-learn linear-regression