【发布时间】:2021-02-24 03:49:18
【问题描述】:
我正在使用 xgboost 训练一些数据,然后我想在测试集上对其进行评分。 我的数据是分类变量和数值变量的组合,因此我使用 pd.get_dummies 来虚拟化所有分类变量。训练很好,但是当我在测试集上对模型进行评分时就会出现问题。
我收到“feature_names_mismatch”错误,它列出了缺失的列。我的数据集已经是一个矩阵(numpy 数组格式)。
特征名称的不匹配是有效的,因为某些虚拟类别可能不存在于测试集中。那么如果发生这种情况,有没有办法让模型仍然有效?
【问题讨论】:
-
最好提供代码以便人们了解您的错误的确切性质。这是您遇到的问题:stackoverflow.com/questions/51860759/…?