【问题标题】:R Prediction on a Linear Regression Model线性回归模型的 R 预测
【发布时间】:2015-05-11 22:36:59
【问题描述】:

我确信这是可以做到的,只是不知道怎么做! 我有一个大约 500 行(csv)的数据集,它显示了足球运动员的比赛状态(例如传球、射门)等。我有他们的一些薪水(大约 10 行),我试图使用预测他们的薪水线性回归方程。

在下面,如果 Y 是薪水,那么 R 是否有办法基本上自动填充?根据我现有的十份薪水,剩下的薪水可能是多少?

lm(y ~ x1 + x2 +x3)

任何帮助将不胜感激。

【问题讨论】:

    标签: r linear-regression prediction


    【解决方案1】:

    这就是predict 函数的作用。

    请注意,您无需显式调用predict.lm。因为调用lm 的结果是类"lm" 的对象,所以当你调用predict 时,R“知道”使用predict.lm

    例如:

    lm1 <- lm(y ~ x1 + x2 +x3)
    y.fitted <- predict(lm1)
    

    【讨论】:

    • 太棒了,谢谢一百万!我如果我有每个团队的实际总工资并且可以获得每个团队的总预测工资,是否可以进行适当的统计测试以确定是否存在统计差异预测和实际之间?我在想卡方,但不确定这是否有意义
    • @CarolineCoughlin 您将不得不将薪水分成“垃圾箱”,这使得您对合身度的衡量完全取决于制作垃圾箱的大小。在线性回归中测量拟合优度的标准方法是 R 平方和调整后的 R 平方,但没有相应的拟合优度检验。您可以对其进行 t 检验,因为它是平方相关,但即使您拒绝“零 r 平方”的空值,也并不意味着您的预测是好的。
    • 一般来说,拟合值和实际值总是“不同”的,因为拟合值是一个条件平均值。也就是说,使用输入 X1 和 Z1 生成预测 Y1。对于拥有 X1 和 Z1 的单身人士来说,Y1 并不是真正的“预测”;但是如果你观察大量的人正好有 X1 和 Z1,平均来说他们也会有 Y1。估计 Y 和真实 Y 的平方差取决于模型未捕获的 Y 中的方差量(又称“随机变化”)。 R 平方可以解释为模型解释的“方差分数”
    • 如果您有更多问题,请访问 stats.stackexchange.com
    • 嗨,谢谢你,关于线性回归拟合问题,我得到了工作 lm(y ~ x1 + x2 +x3) 的代码,但它只预测我知道的十个变量的值,是否存在我需要为未知数输入一个值以获取预测值?还有没有办法将这些结果放入新的 csv 文件中?
    【解决方案2】:

    您还应该能够使用 DAAG 库中的函数 cv.lm 进行交叉验证来测试模型的预测准确性。使用此功能,您可以创建测试数据来测试使用训练数据生成的模型。

    【讨论】:

      猜你喜欢
      • 2014-05-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-04-28
      • 2021-02-25
      相关资源
      最近更新 更多