【问题标题】:What would it mean when a variable is highly correlated with intercept in proc logistic in SAS?当变量与 SAS 中 proc 逻辑中的截距高度相关时,这意味着什么?
【发布时间】:2011-06-09 21:42:36
【问题描述】:

我从我的一份 proc 逻辑报告中发现,某个变量与截距高度相关。我该如何解释它?我应该改变什么来修正这种相关性?

编辑:尝试从更理论的角度提出这个问题。在大多数逻辑回归包的估计相关分析输出中,如果您看到截距估计与某个变量高度相关,这意味着什么?你会如何处理这样的情况?希望这是一种更清晰的提问方式。非常感谢大家。

【问题讨论】:

  • 我认为你应该进一步抽象这个问题:P
  • 谢谢克里斯,看看编辑后的版本是否有帮助:)
  • 您的意思是截距在您的模型中很重要吗?我手头没有我的统计书籍,但我知道根据情况进行重大拦截是有意义的。如果自变量为零,截距的值是否会给因变量一个有意义的值?这是一个纯粹的统计问题,所以也许你可以在这里得到更好的回答:stats.stackexchange.com
  • Murray,对于你的问题,根据 wald 卡方检验,截距和所有其他自变量是显着的(尽管它不是很可靠)。我的问题是所有系数都很重要,并且截距系数估计与一个独立的系数估计相关。但是你提出了一个我很想知道的附带问题:如果自变量系数估计不显着,我是否应该相信该变量的相关分析?这只是一个附带问题,与我原来的问题没有直接关系。谢谢。

标签: statistics sas regression


【解决方案1】:

截距系数和协变量之间的正相关意味着您的大部分协变量值为负(反之亦然:负相关将与正值相关)。

这不仅限于逻辑回归,使用线性回归可能更容易看到。将您的值的散点图视为 y 轴右侧的一团,并绘制最佳拟合线性回归线。现在稍微增加它的 y 截距和斜率:如果“blob”足够远,这条线将完全错过它。因此,您不能在获得合理拟合线的同时将两个参数移动到同一方向。换句话说,估计值是负相关的。

实际上,这没什么大不了的。确实,截距的估计值会有很大的可变性,但是如果您的大部分数据远离 0,这并不奇怪。通常 x=0 没有意义,因此您甚至都不关心截距。如果您无法忍受看到这些大的相关性,只需将您的 x 变量居中即可。 y 轴将移动到数据的中间,相关性将神奇地消失。当然,截距的含义也会发生变化,但这通常是可取的。

【讨论】:

  • 好点。也许那个特定变量的值方差不大,而且离 y 轴很远。我会看看。但是解释真的很好。我很满意。谢谢。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2016-05-18
  • 1970-01-01
  • 2021-10-24
  • 2017-03-27
相关资源
最近更新 更多