【发布时间】:2020-10-30 23:28:45
【问题描述】:
我正在尝试将多线性回归相应地应用于训练和测试数据集,如下所示:
library(caTools)
set.seed(123)
split = sample.split(data$G3, SplitRatio = 0.8)
train_set = subset(data, split == TRUE)
test_set = subset(data, split == FALSE)
write.csv(train_set, "student_train.csv", row.names = FALSE)
write.csv(test_set, "student_test.csv", row.names = FALSE)
#Multilinear regression
multi = lm(formula = G3 ~ ., data = train_set)
#Predicting the test values
y_pred_m = predict(multi, newdata = test_set)
library(Metrics)
mae_m = mae(test_set[[10]], y_pred_m)
rmse_m = rmse(test_set[[10]], y_pred_m)
但是,我的 mae 和 rmse 值都在控制台中返回为 NA,在“环境”选项卡中返回为 NA_real_。我的 data$G3 值不是一个因素,所以我不确定为什么会收到以下错误消息:In Ops.factor(actual, predicted) : ‘-’ not meaningful for factors. 我是使用 R 进行回归的新手,所以请帮忙。
【问题讨论】:
-
与其包含数据的屏幕截图,不如将输出
dput(data)粘贴到问题的文本中会很有帮助。这将允许其他人在本地复制数据集。
标签: r regression linear-regression