【发布时间】:2013-12-04 09:37:42
【问题描述】:
我一直在尝试在回归树(或随机森林回归器)中使用分类输入,但 sklearn 不断返回错误并要求输入数字。
import sklearn as sk
MODEL = sk.ensemble.RandomForestRegressor(n_estimators=100)
MODEL.fit([('a',1,2),('b',2,3),('a',3,2),('b',1,3)], [1,2.5,3,4]) # does not work
MODEL.fit([(1,1,2),(2,2,3),(1,3,2),(2,1,3)], [1,2.5,3,4]) #works
MODEL = sk.tree.DecisionTreeRegressor()
MODEL.fit([('a',1,2),('b',2,3),('a',3,2),('b',1,3)], [1,2.5,3,4]) # does not work
MODEL.fit([(1,1,2),(2,2,3),(1,3,2),(2,1,3)], [1,2.5,3,4]) #works
据我了解,这些方法中的分类输入应该是可能的,无需任何转换(例如 WOE 替换)。
还有其他人遇到过这种困难吗?
谢谢!
【问题讨论】:
标签: python regression scikit-learn