【发布时间】:2012-08-29 14:57:01
【问题描述】:
我需要创建以下公式的线性回归图,但我不明白在 R 中哪种方法是正确的:
lm.velocity_vs_Velocity_response = lm(scrd$Velocity~scrd$Velocity_response*scrd$Subject)
scrd 是我的数据集,可以在这里下载:https://dl.dropbox.com/u/3288659/Velocity_vs_Velocity.csv
对应于实验的数据集包含 2 个变量(Velocity 和 Velocity_response),我想知道两者之间是否存在线性相关性。假设第一个是在 4 种地形条件(雪、木头、砾石和“无声”的材料)下行驶的汽车的速度,第二个是导体的感知速度。在实验中,10 名参与者重复了 4 种条件,在实验结束时,他们必须评估他们在这些条件下驾驶时的感知速度。在视觉模拟量表上进行评估,其中 0 = 非常慢,10 = 非常快。 因此,我的回归中有 80 分(10 名参与者 * 2 次试验 * 4 次速度估计)。然而,在数据集中,我决定对 2 次试验的性能进行平均。
我用来做回归的公式的输出,
summary(lm.velocity_vs_Velocity_response)
是
Residual standard error: 0.08377 on 20 degrees of freedom
Multiple R-squared: 0.91, Adjusted R-squared: 0.8245
F-statistic: 10.64 on 19 and 20 DF, p-value: 1.085e-06
从中我得出结论,两个变量之间存在很强的相关性(R^2 = 0.91 和 p 值
现在,我希望看到拟合这些数据的线性回归的线。 它是如何在 R 中完成的?哪个是正确的公式? 谁能提供R中的代码示例?
问题是使用 plot 我得到了一堆乱七八糟的点,而且我看不到线性趋势。
我在这里发布数据集的第一行
Subject Material Velocity Velocity_response
Subject1 no_sound 1.41 7.8
Subject1 snow 1.255 4
Subject1 gravel 1.32 5.3
Subject1 wood 1.335 5.4
Subject2 no_sound 1.435 10
Subject2 snow 1.265 1.7
Subject2 gravel 1.3 8.5
Subject2 wood 1.355 5.3
【问题讨论】:
-
另外,你好像有重复的措施。如果是这样,您根本不应该使用 lm 。您可能应该使用混合模型。
-
lm 有一个与之关联的 plot()。您可以使用绘图(lm.velocity_vs.Velocity_response)。此外,velocity_response 肯定应该在模型的左侧,而速度在右侧。说速度取决于响应是没有意义的。然后您可能需要序数逻辑回归。
-
大家好,感谢您的回答。为了回答彼得弗洛姆,我当然有重复的措施。那么使用lm是对还是错呢?我不是 R 专家,也不是静态学家 ;-(,如果可能的话,我需要混合模型的代码帮助,如果使用 lm 是错误的。我不知道什么是序数逻辑回归,也不知道hpw 来执行它...显然 Greg Snow 同意使用 lm。我很困惑。有人可以澄清这个问题吗?非常感谢
标签: r regression interaction