【问题标题】:Plot of a linear regression with interactions具有交互作用的线性回归图
【发布时间】:2012-08-29 14:57:01
【问题描述】:

我需要创建以下公式的线性回归图,但我不明白在 R 中哪种方法是正确的:

lm.velocity_vs_Velocity_response = lm(scrd$Velocity~scrd$Velocity_response*scrd$Subject)

scrd 是我的数据集,可以在这里下载:https://dl.dropbox.com/u/3288659/Velocity_vs_Velocity.csv

对应于实验的数据集包含 2 个变量(Velocity 和 Velocity_response),我想知道两者之间是否存在线性相关性。假设第一个是在 4 种地形条件(雪、木头、砾石和“无声”的材料)下行驶的汽车的速度,第二个是导体的感知速度。在实验中,10 名参与者重复了 4 种条件,在实验结束时,他们必须评估他们在这些条件下驾驶时的感知速度。在视觉模拟量表上进行评估,其中 0 = 非常慢,10 = 非常快。 因此,我的回归中有 80 分(10 名参与者 * 2 次试验 * 4 次速度估计)。然而,在数据集中,我决定对 2 次试验的性能进行平均。

我用来做回归的公式的输出,

 summary(lm.velocity_vs_Velocity_response)

Residual standard error: 0.08377 on 20 degrees of freedom
Multiple R-squared:  0.91,  Adjusted R-squared: 0.8245 
F-statistic: 10.64 on 19 and 20 DF,  p-value: 1.085e-06 

从中我得出结论,两个变量之间存在很强的相关性(R^2 = 0.91 和 p 值

现在,我希望看到拟合这些数据的线性回归的线。 它是如何在 R 中完成的?哪个是正确的公式? 谁能提供R中的代码示例?

问题是使用 plot 我得到了一堆乱七八糟的点,而且我看不到线性趋势。

我在这里发布数据集的第一行

Subject     Material    Velocity    Velocity_response
Subject1    no_sound    1.41        7.8
Subject1    snow        1.255       4
Subject1    gravel      1.32        5.3
Subject1    wood        1.335       5.4
Subject2    no_sound    1.435       10
Subject2    snow        1.265       1.7
Subject2    gravel      1.3         8.5
Subject2    wood        1.355       5.3

【问题讨论】:

  • 另外,你好像有重复的措施。如果是这样,您根本不应该使用 lm 。您可能应该使用混合模型。
  • lm 有一个与之关联的 plot()。您可以使用绘图(lm.velocity_vs.Velocity_response)。此外,velocity_response 肯定应该在模型的左侧,而速度在右侧。说速度取决于响应是没有意义的。然后您可能需要序数逻辑回归。
  • 大家好,感谢您的回答。为了回答彼得弗洛姆,我当然有重复的措施。那么使用lm是对还是错呢?我不是 R 专家,也不是静态学家 ;-(,如果可能的话,我需要混合模型的代码帮助,如果使用 lm 是错误的。我不知道什么是序数逻辑回归,也不知道hpw 来执行它...显然 Greg Snow 同意使用 lm。我很困惑。有人可以澄清这个问题吗?非常感谢

标签: r regression interaction


【解决方案1】:

如果你像这样运行 lm,你的生活会轻松很多:

lm.velocity_vs_Velocity_response <- lm(Velocity~Velocity_response*Subject, data=scrd)

然后查看 TeachingDemos 包中的 Predict.PlotTkPredict 函数来探索关系和交互。

【讨论】:

  • 这当然是真的,@Greg。另外,我会建议一个更短一点的型号名称,但这可能是个人喜好。
  • 感谢 sintax 的建议。请让我知道上述评论
  • @PeterFlom 和 Luca,我也建议使用更短的对象名称,但是我倾向于在另一端犯错更多,并且过度使用诸如“fit”和“tmp”之类的名称,上面肯定更多描述性的。使用混合模型也是一个好主意(我没有仔细阅读以捕捉重复的措施)。您可以使用 lm 进行重复测量(但您的模型中需要更多项),但更喜欢混合效果方法(但不适用于我提到的函数)。
  • 好的,谢谢你的回复,但是既然有重复的措施是不是不够用lm中的交互? Morevor,“您的模型中需要更多术语”是什么意思?这些是我拥有的数据。有人可以向我展示 R 代码来执行我需要的线性回归并用回归线绘制图形吗?最后,我注意到两次试验中产生的速度已被平均。
  • @Luca,你能给我们看一些实际数据(或正确形式的模拟数据)吗,使用dput以便可以剪切和粘贴。您是否有跨不同度量的同一主题的 id 变量?有了这些信息,我们就有更好的机会获得帮助。
猜你喜欢
  • 2020-12-10
  • 2012-05-20
  • 2021-04-09
  • 1970-01-01
  • 2021-01-29
  • 2014-09-28
  • 2014-07-06
  • 2018-02-08
  • 1970-01-01
相关资源
最近更新 更多