【发布时间】:2022-01-18 22:14:49
【问题描述】:
我在执行 ML 项目时遇到了问题。希望得到您的建议!
我在一个只有 15 个特征的数据集上拟合了逻辑 LASSO,试图预测二元结果。我知道 LASSO 应该进行特征选择并消除不重要的特征(系数 = 0),但在我的分析中,它选择了所有特征并且没有消除其中任何一个。我的问题是:
- 这是因为我的特征太少,还是因为特征彼此不相关(低共线性?)
- 这对分类模型来说是坏事还是好事?
- LASSO 所选特征的某些系数小于 0.1,我可以将它们解释为对模型不重要还是不那么重要?
附言我使用 python 中的 sklearn 包运行模型。
谢谢!
【问题讨论】:
-
您的问题需要进一步澄清!请看一下“如何提出一个好问题”(stackoverflow.com/help/how-to-ask)和“如何创建一个最小的、可重现的示例”(stackoverflow.com/help/minimal-reproducible-example )。它可以帮助您增强您的问题。
标签: python machine-learning feature-selection lasso-regression