【发布时间】:2018-03-08 19:59:57
【问题描述】:
我正在尝试在 python 中使用 xgboost 解决回归问题。但是我遇到了一个问题。我已经搜索了很多地方,但无法获得任何具体结果。
我有一个食品聚合商的商业模式。我平台上的用户可以从许多不同的餐厅订购。
我想在用户下订单后使用回归模型来预测订单的 ETA(以显示在应用程序上)。我正在考虑在我的训练模型中使用“restaurant_id”作为特征。但现在的问题是我的平台上列出了 100 多家餐厅。而且我不能使用它的数字功能。我必须使用它的分类特征。如何处理这种情况?即如何处理具有这么多不同值的分类特征?
我在 python 中使用 Xgboost。我使用了熊猫的 get_dummies 函数。我不确定是这样做还是遵循其他方法。任何建议都会有所帮助。
提前致谢。
【问题讨论】:
-
你想用 XGBoost 预测 ETA 吗?
-
@AmeyYadav 我可以使用任何算法,xgboost 不是唯一的。但想法是如何解决这个问题,我被困在了
标签: python scikit-learn regression xgboost one-hot-encoding