1. 引言:Why Sklearn?
1.1. scikit-learn 是基于 Python 语言的机器学习工具。
- 简单高效的数据挖掘和数据分析工具;
- 可供大家在多环境、跨平台中重复使用;
- 建立在 NumPy ,SciPy 和 matplotlib 上;
- 开源,可商业使用 - BSD许可证。
1.2 scikit-learn 功能架构
- Classification分类
- SVM支持向量机
- k-最近邻
- 随机森林等
- Regression回归
- SVR等
- Clustering聚类
- k-means等
- Dimensionality reduction降维
- PCA
- 特征选择等
- Model Selection模型选择
- Preprocessing数据、模型预处理
- 预处理
- 特征提取等
1.3 官方文档英/中
学习scikit-learn如同学习机器学习知识一般,理论知识、代码实现和可视化结果,有助于快速入门机器学习。
scikit-learn官方英文文档:https://scikit-learn.org/stable/index.html
考虑到英文文档阅读起来较为吃力,Github上目前已经更新了译者版本的中文文档,请查阅链接:
http://sklearn.apachecn.org/#/
2. SciKit-Learn学习路线
主要内容如下,另外,点击超链接即可传送至视频出处进行详细观看和学习。
-
Sklearn 简介
-
一般使用
-
高级使用
3. 一般应用
3.1 选择学习方法
3.2 通用学习模式
3.3 sklearn 强大库函数
3.4 sklearn 常用属性与功能
4. 高级应用
4.1 正规化
4.2 检验神经网络
4.3 交叉验证
4.4 保存和加载模型