【发布时间】:2012-12-27 18:12:29
【问题描述】:
可能重复:
short formula call for many variables when building a model
我有一个大数据框(112 个变量),我想对使用 R 进行逐步逻辑回归。我知道如何设置 glm 模型和 stepAIC 模型,但我更愿意不要输入所有标题来输入自变量。有没有一种快速的方法可以为glm 模型提供一个完整的数据框作为自变量,以便它将每一列识别为要包含在模型中的 x 变量?我试过了:
ft<-glm(MFDUdep~MFDUind, family=binomial)
但它不起作用(错误的数据类型)。 MFDUdep 和 MFDUind 都是数据帧,MFDUind 包含 111 个“x”变量,MFDUdep 包含一个“y”。
【问题讨论】:
-
我可以提出一个相当强烈的建议,除非你有一个真的很好的相反理由,否则你使用某种形式的惩罚回归(例如
glmnet包)而不是逐步回归? -
我会考虑到这一点,但这并不能真正回答我的问题。
-
这不是为了回答你的问题,但如果有人问我去机场的路线,我注意到他们的头发着火了,我还是要提一下。跨度>
-
使用逐步回归相当于发了火吧?我在较小的数据样本上使用了最佳子集,并且通常在实践中没有发现太大的差异(在那个和 f-b 逐步之间)。
-
嗨@TomR 我注意到尽管感谢人们的良好回应,但您尚未接受对您的 5 个Stack Overflow 问题的任何答案。请参阅faq 的How to Ask 部分,了解有关如何接受答案及其有用的详细信息。请注意,您没有义务这样做,并且只有当它确实回答了您的问题时,您才应该接受答案。
标签: r dataframe regression