python scikit通过核心学习学习超参数调优

【问题标题】：python scikit learn hyperparameter tuning with out of core learningpython scikit通过核心学习学习超参数调优
【发布时间】：2026-02-15 09:25:02
【问题描述】：

目前我正在使用

clf = SGDClassifier(loss='log', random_state=1, n_iter=1)

为我训练一个预测模型。但是，训练数据非常大，所以我使用的是核心学习。

clf.partial_fit(X_train, y_train, classes=classes)

另外，我想通过例如GridSearchCV(http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html) 实现超参数调整

但似乎GridSearchCV 没有提供partial_fit 方法，因此无法进行核外学习，我必须将整个数据集保存在内存中。有没有办法在仍然使用核外学习的同时进行超参数调整？

【问题讨论】：

嗨 Micha，你解决了吗？找到解决问题的方法了吗？
@manishthapliyal 不幸的是，还没有。
我找到了一种使用随机森林进行增量学习的方法，有一个名为 scikit-graden 的库，他们有一个 Mondarian 分类器，可以将增量或在线学习添加到随机森林

标签： python machine-learning scikit-learn grid-search large-data

【解决方案1】：

我找到了一种使用随机森林进行增量学习的方法，有一个名为 scikit-graden 的库，他们有一个 mondrian 分类器，可以将增量或在线学习添加到随机森林。

查看这个关于蒙德里安森林的博客： https://medium.com/mlrecipies/mondrian-forests-making-random-forests-better-and-efficient-b27814c681e5

【讨论】：

猜你喜欢

如何在 Azure 机器学习中导入“scikit-multilearn”python 库 2026-02-02
强化学习 - 给定分数优化权重 2026-01-21
学习 SSIS 2008 [关闭] 2026-01-11
我们可以通过 HMM 进行监督学习吗？ 2026-01-24
Spark机器学习AST对比 2026-01-12
TensorFlow 指数衰减学习率似乎不起作用 2026-02-12
机器学习服务器远程会话设置失败 2026-01-10
WSO2 IoT 服务器中缺少机器学习器向导 2026-01-10
在 ASP.NET 上构建维基百科（学习练习）。如何清理不受信任的数据，但保持格式化？ 2026-01-13

相关资源

python scikit-learn学习笔记中文PDF版下载 2022-12-05
DevExpress控件学习 WORD版下载 2023-04-14
JVM的学习中文word版下载 2023-06-08
JSF入门深入学习 WORD版下载 2022-12-08
PHP基础学习资料 PDF版下载 2023-02-01

最近更新更多

热门标签

Java Python linux javascript C# Mysql Docker 算法前端 SpringBoot Redis Vue spring .net 设计模式 .net core c++ kubernetes 数据库机器学习大数据数据结构微服务 js 人工智能 Go Android 面试程序员 JVM 云原生后端 ASP.net core 深度学习 CSS k8s git golang PHP devops Nginx Django React mybatis 架构多线程 Spring Boot 云计算 LeetCode 分布式