【发布时间】:2016-05-29 11:03:07
【问题描述】:
我正在使用 glmnet 包执行 LASSO 回归。有没有办法获得所选择的各个变量的重要性?我考虑过对通过 coef(...) 命令获得的系数进行排名(即,与零的距离越大,变量就越重要)。这会是一种有效的方法吗?
感谢您的帮助!
cvfit = cv.glmnet(x, y, family = "binomial")
coef(cvfit, s = "lambda.min")
## 21 x 1 sparse Matrix of class "dgCMatrix"
## 1
## (Intercept) 0.14936
## V1 1.32975
## V2 .
## V3 0.69096
## V4 .
## V5 -0.83123
## V6 0.53670
## V7 0.02005
## V8 0.33194
## V9 .
## V10 .
## V11 0.16239
## V12 .
## V13 .
## V14 -1.07081
## V15 .
## V16 .
## V17 .
## V18 .
## V19 .
## V20 -1.04341
【问题讨论】:
-
glmnet缩放输入变量,因此在某种意义上,您选择具有最高“缩放效果”的变量。不知何故,它应该很重要,并且有一些论文实际上试图解决这个特定问题(Hastie and Tibshirani 最近的书也讨论了这个问题)。但是,这确实是 StackExchange 的问题