【发布时间】:2019-07-11 09:26:19
【问题描述】:
我的数据集在预处理后由 160 万行和 17000 列组成。我想对这些数据使用逻辑回归,但是每次加载数据集时都会终止该过程。有没有办法可以分块训练逻辑回归模型,每次迭代都会更新系数。 sklearn 是否支持任何技术来解决我的问题?
【问题讨论】:
-
您使用的是哪种逻辑回归算法?
-
一种选择是
partial_fitLR & SVM 的SGDClassifier方法;见Is it possible to train a sklearn model (eg SVM) incrementally?
标签: python machine-learning nlp bigdata logistic-regression