【问题标题】:Categorical variables with too many levels in machine learning机器学习中层次过多的分类变量
【发布时间】:2017-04-24 11:20:38
【问题描述】:

我有一个机器学习问题,其中因变量是二项式(是/否),而一些自变量是分类变量(超过 100 个级别)。我不确定虚拟编码这些分类变量然后将它们传递给机器学习模型是否是最佳解决方案。

有没有办法解决这个问题?

谢谢!

【问题讨论】:

  • 这类题,不涉及编程,不属于StackOverflow。在网上搜索或发帖至stats.stackexchange.com
  • 我们可以提问对吧?

标签: machine-learning logistic-regression


【解决方案1】:

您可以尝试在分类变量上创建虚拟变量。在此之前,尝试组合一些分类变量。

【讨论】:

    猜你喜欢
    • 2018-11-09
    • 2017-10-24
    • 2017-08-18
    • 2020-05-04
    • 1970-01-01
    • 2016-08-16
    • 2015-06-03
    • 1970-01-01
    • 2023-04-04
    相关资源
    最近更新 更多