【发布时间】:2013-07-05 07:34:13
【问题描述】:
我一直在使用glm 函数进行回归分析,它对我很好。不过我想知道,我想要回归的一些事情涉及大量的回归因素。我有两个主要问题:
- 是否可以为回归量提供文本向量?
- 可以对
summary(glm)的p 值部分进行排序吗?最好通过每个回归器的 p 值。
例如
A # sample data frame
names(A)
[1] Dog Cat Human Limbs Tail Height Weight Teeth.Count
a = names(A)[4:7]
glm( Dog ~ a, data = A, family = "binomial")
【问题讨论】:
-
您可以使用类似
glm(A$Dog ~ ., data = A[,4:7])的方式指定矩阵中的所有剩余列。 -
您希望按 p 值对输出进行排序,这暗示了您对统计的误解。但是,就像 R 中的几乎任何东西一样,它可以做到。
-
我是数学家,不是统计学家,但 p 值不是表示结果是随机的概率吗?因此,回归量的强度是相关的 p 值?
-
@riders994,没有效果的强度和意义是两个不同的东西。对于前者,您需要考虑效果的大小,例如通过比较标准化系数或使用 Cohen 的效应大小检验。另外,我认为您的模型中的变量将高度相关(例如身高和体重),这意味着您将遇到严重的多重共线性问题,从而导致模型不可靠。
-
我的实际数据要复杂得多,而且我一直在其中看到多重共线性问题。我会查一下你描述的这些测试。感谢您的帮助!
标签: r sorting statistics regression