【发布时间】:2020-08-05 16:17:42
【问题描述】:
我使用来自篮球参考的数据创建了这个 DataFrame,我得到了每个特征的平均值。 DataFrame Data 无论我用哪一列来训练我的线性模型,我的 R2 分数都接近 0,而且预测很糟糕。
import pandas as pd
import numpy as np
from sklearn import linear_model
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import r2_score
import math
percent=math.floor(len(df)*0.80)
X=df['Mean MP'].to_numpy()
Y=df['BPM'].to_numpy()
Y=Y.reshape(Y.shape[0], )
X=StandardScaler().fit_transform(X)
X_train=X[:percent]
Y_train=Y[:percent]
X_test=X[percent:]
Y_test=Y[percent:]
model=linear_model.LinearRegression()
model.fit(X_train,Y_train)
a=r2_score(Y_test,model.predict(X_test))
a=-0.07
我认为这是我创建或使用 DataFrame 的方式,但我不知道如何解决问题。 我希望你能帮助我,谢谢。
【问题讨论】:
标签: python pandas dataframe linear-regression