【问题标题】:Whay did LASSO fail to perform feature selection?LASSO 未能执行特征选择的原因是什么?
【发布时间】:2022-01-18 22:14:49
【问题描述】:

我在执行 ML 项目时遇到了问题。希望得到您的建议!

我在一个只有 15 个特征的数据集上拟合了逻辑 LASSO,试图预测二元结果。我知道 LASSO 应该进行特征选择并消除不重要的特征(系数 = 0),但在我的分析中,它选择了所有特征并且没有消除其中任何一个。我的问题是:

  1. 这是因为我的特征太少,还是因为特征彼此不相关(低共线性?)
  2. 这对分类模型来说是坏事还是好事?
  3. LASSO 所选特征的某些系数小于 0.1,我可以将它们解释为对模型不重要还是不那么重要?

附言我使用 python 中的 sklearn 包运行模型。

谢谢!

【问题讨论】:

  • 您的问题需要进一步澄清!请看一下“如何提出一个好问题”(stackoverflow.com/help/how-to-ask)和“如何创建一个最小的、可重现的示例”(stackoverflow.com/help/minimal-reproducible-example )。它可以帮助您增强您的问题。

标签: python machine-learning feature-selection lasso-regression


【解决方案1】:

Lasso 没有失败地执行特征选择。它只是确定这 15 个特征中没有一个是不重要的。对于您获得系数 = 0.1 的那个,这仅意味着与其他更重要的特征相比,它们不那么重要。所以我不会担心!

另外 15 个特征并不是 Lasso 确定重要特征的大量特征。我的意思是它取决于数据,因此对于某些数据集,它可以从 10 个特征的数据集中消除一些特征,有时它不会从 20 个特征的数据集中消除任何特征。这仅取决于数据!

干杯!

【讨论】:

    猜你喜欢
    • 2021-07-26
    • 1970-01-01
    • 2021-02-04
    • 1970-01-01
    • 2018-10-31
    • 2015-08-02
    • 1970-01-01
    • 1970-01-01
    • 2017-12-04
    相关资源
    最近更新 更多