【发布时间】:2017-05-14 01:38:08
【问题描述】:
在生产中运行时,是否可以在不重新拟合模型的情况下使用新数据更新经过训练的模型?我看到您可以使用 warm_start 参数来启用向模型添加树;但是,我正在寻找一种使用传入数据更新现有树的方法。
【问题讨论】:
标签: python machine-learning scikit-learn random-forest
在生产中运行时,是否可以在不重新拟合模型的情况下使用新数据更新经过训练的模型?我看到您可以使用 warm_start 参数来启用向模型添加树;但是,我正在寻找一种使用传入数据更新现有树的方法。
【问题讨论】:
标签: python machine-learning scikit-learn random-forest
据我所知,这对于 sklearn 是不可能的(因为它们似乎实现了经典的 Breiman 算法)。但是,您可能会看看 Mondrian Forests(https://papers.nips.cc/paper/5234-mondrian-forests-efficient-online-random-forests.pdf,python 实现:https://github.com/balajiln/mondrianforest)。
【讨论】: