【发布时间】:2013-08-05 20:11:58
【问题描述】:
我正在尝试使用多个因变量和多个自变量进行回归。基本上我在整个美国的县级都有House Prices,这是我的IV。然后我有几个县级的其他变量(GDP、construction employment),这些构成了我的因变量。我想知道是否有一种有效的方法可以同时进行所有这些回归。我想得到:
lm(IV1 ~ DV11 + DV21)
lm(IV2 ~ DV12 + DV22)
我想为每个自变量和每个因变量执行此操作。
编辑: OP 添加此信息以响应我的回答,现已删除,这误解了问题。
我认为我没有很好地解释这个问题,我很抱歉。每个因变量都有 2 个与之关联的自变量,它们是唯一的。因此,如果我有 500 个因变量,我就有 500 个唯一的自变量 1 和 500 个唯一的自变量 2。
好的,我会再试一次,如果我不能再次解释自己,我可能会放弃(哈哈)。我不知道你所说的来自 R 的 mtcars 是什么意思,尽管 [这是参考 Metrics 的答案],所以让我试试这种方式。我将有 3 个数据向量,每个向量大约 500 行。我正在尝试从每行数据中构建回归。假设向量 1 是我的因变量(我试图预测的变量),向量 2 和 3 构成了我的自变量。因此,第一个回归将包含每个向量的第 1 行值,第二个回归将包含每个向量的第 2 行值,依此类推。再次感谢大家。
【问题讨论】:
-
“因变量”是指您要预测的数字,“自变量”是您想要用来进行预测的数字吗?请注意,在 R 的公式语法中,因变量在波浪号的左侧,而 IV 在 RHS 上(
lm(DV ~ IV))。 -
PLS regression 是一种选择。
-
对不起,我确实说反了。我切换了我的 IV 和 DV。我还标记了我的问题以将其移至堆栈溢出,因为我主要研究如何在 R 中实现它,因为我理解它背后的概念。谢谢你。
-
寻找比单独回归更有效的方法的原因是什么?是的,效率有所损失,但无论如何解决方案都非常迅速,似乎收效甚微。
-
因为我每个季度都在尝试为 500 多个县执行此操作,如果我必须单独运行其中的每一个,该项目将变得不可行,因为它需要时间。我试图看看我是否可以基本上导入 1-2 个大型数据矩阵,并自动进行回归,但我不确定这是否可能。
标签: r