【问题标题】:Should I use both OneHotEncoder and OrdinalEncoder in one dataset?我应该在一个数据集中同时使用 OneHotEncoder 和 OrdinalEncoder 吗?
【发布时间】:2022-01-10 14:08:27
【问题描述】:

如果数据集同时包含标称列和有序列,该数据集是否需要不同的编码器,例如用于标称的 OneHotEncoder 和用于序数值的 OrdinalEncoder?

【问题讨论】:

    标签: data-science data-analysis one-hot-encoding data-preprocessing


    【解决方案1】:

    是的,分类/标称和数字(包括序数)变量需要区别对待,并且经常会遇到具有多种类型变量的数据集。

    【讨论】:

    • 好的,感谢您的澄清。我还有一个问题,如果我选择将 LabelHotEncoder 应用于序数和标称值的简单方法,会有什么问题吗?
    • 这不尊重序数变量的顺序。
    • 我的意思是,回归算法会有问题,但分类器算法不会有问题?
    • 两者都会有“问题”
    猜你喜欢
    • 1970-01-01
    • 2021-03-27
    • 2014-08-12
    • 2021-05-18
    • 2023-03-12
    • 1970-01-01
    • 2012-06-21
    • 2023-03-17
    • 1970-01-01
    相关资源
    最近更新 更多