【发布时间】:2014-10-18 13:15:16
【问题描述】:
我正在使用 R 对我的数据集执行逻辑回归。我的数据集有 50 多个变量。
挑战在于用 R 编写代码,以评估某些记录和变量(例如 p 值 >.05)的统计有效性,并根据诸如此类的参数从模型中消除记录和变量。
是否有任何已经实现的方法可以做到这一点?任何帮助或建议将不胜感激。谢谢。
【问题讨论】:
-
查看 stats::step 或 MASS::stepAIC。这当然是基于 AIC 而不是 p 值,但这可能更合适。
-
@J.R.除了它不是(更合适的)。像这样进行特征选择与通过 p 值进行相同,当您通过 AIC 这样做时,您只是使用了不同的 alpha(显着性)级别。
-
同意加文。使用 AIC 的惩罚相当温和,尤其是在逐步使用时。
-
@GavinSimpson,指出并感谢。有了“可能......”的论点,我在考虑非嵌套模型时只是为了方便。 OP 可以咨询 Cross Validated 进行讨论或其他相关方法。
标签: r regression logistic-regression