【问题标题】:Training a categorical classification example训练分类分类示例
【发布时间】:2018-03-02 16:54:59
【问题描述】:

我是机器学习的新手。我目前正在解决一个以字符串为目标的分类问题。我已经拆分了测试集和训练集,并通过将它们转换为OneHotEncoder 来处理字符串属性,并且我正在使用StandardScaler 来缩放训练集的数值特征。

我的问题是关于测试集的,我是否需要转换仍然为字符串格式的测试集目标,就像我使用OneHotEncoder 对训练集的字符串目标所做的那样,或者我是否将测试集单独保留为是的,分类器会自己完成这项工作吗?同样对于数字属性,我是否必须使用StandardScaler 来缩放测试集中的数字属性,或者一旦在训练集上完成训练,分类器就会自行完成?

【问题讨论】:

标签: python machine-learning


【解决方案1】:

对于第一个问题,我想说,你不需要转换它,但它会使测试集的评估更容易。 您的分类器将输出一个热编码值,您可以将其转换回字符串并评估这些值,但是我认为如果您将测试目标设为 0-1 会有所帮助。

对于第二个,您需要在训练集上拟合标准缩放器,并在测试集上使用(转换)它。

【讨论】:

    猜你喜欢
    • 2013-04-11
    • 2021-07-03
    • 2018-02-13
    • 2021-04-26
    • 2015-09-21
    • 1970-01-01
    • 2018-01-01
    • 2015-01-13
    • 2014-11-30
    相关资源
    最近更新 更多