【发布时间】:2018-04-28 07:52:56
【问题描述】:
我曾使用 Scikit Learn Library 进行机器学习。 我在使用回归时遇到了一些与虚拟变量相关的问题。我有 2 组样本用于训练集和测试集。实际上,程序使用训练集创建“预测模型”,然后使用“测试”来检查分数。在运行程序时,如果形状相等,就可以了。但是虚拟变量,会改变形状,导致不同 形状。
例子
训练集:130行*3列
训练集:60行*3列
将第 1 列和第 2 列设为虚拟后,现在形状正在发生变化
训练集:130行*15列
训练集:60行*12列
有什么办法可以解决这个问题吗? 如果可能与否,即使数据形状不同,也要取得成功
示例程序:https://www.dropbox.com/s/tcc1ianmljf5i8c/Dummy_Error.py?dl=0
【问题讨论】:
-
能否在问题中包含相关代码和示例数据?
-
我已经包含在上面的链接中
-
您应该提供一个重现您的问题的小示例。请查看如何创建minimal reproducible example
标签: python machine-learning scikit-learn linear-regression dummy-variable