【发布时间】:2020-09-22 17:04:51
【问题描述】:
我是机器学习和 Python 的新手。我正在尝试建立一个随机森林模型来预测水泥强度。
有两个.csv 文件:train_data.csv 和test_data.csv。
这就是我所做的。我试图在这里预测r2_score。
df=pd.read_csv("train_data(1).csv")
X=df.drop('strength',axis=1)
y=df['strength']
model=RandomForestRegressor()
model.fit(X,y)
X_test=pd.read_csv("test_data.csv")
y_pred=model.predict(X_test)
acc_R=metrics.r2_score(y,y_pred)
acc_R
这里的问题是y和y_pred的形状不同。所以我得到这个错误:
ValueError: Found input variables with inconsistent numbers of samples: [721, 309]
我该如何纠正这个问题?有人可以向我解释我做错了什么吗?
【问题讨论】:
标签: python machine-learning scikit-learn random-forest