机器学习简易入门-附推荐学习资料（黄海广博士原创）

本文转载自黄海广博士的微信公众号，链接为：添加链接描述

一、机器学习正规学习路线

如何学好机器学习？正规路线大概是这样的：

1.学好数学基础

数学分析（微积分），线性代数，概率论，统计，应用统计，数值分析，常微分方程，偏微分方程，数值偏微分方程，运筹学，离散数学，随机过程，随机偏微分方程，抽象代数，实变函数，泛函分析，复变函数，数学建模，拓扑，微分几何，渐近分析…

2.学习经典机器学习书和教程

经典书籍：Duda的《模式分类》、Mitchell的《机器学习》、李航的《统计学习方法》、周志华的《机器学习》…

吴恩达：《机器学习》公开课、《深度学习》公开课。

林轩田：《机器学习基石》、《机器学习技法》。

…

3.学好编程语言

精通Python、Java、R、MATLAB、C++等编程语言。

4.阅读论文

学好英语，熟读经典论文，并且读最新的机器学习论文，如顶级会议论文等，掌握最新的技术方向。

5.参加实际项目

如大厂实习、参加Kaggle、天池等数据竞赛…
按照以上路线学完以后，虽然不一定能成为业界大牛，博士毕业完全没有问题了。

以上方法存在的问题：

大部分学习者的学习目的不是为了科研，而是希望把机器学习作为工具来使用。
大部分学习者时间有限，学不完这么多资料，不知道如何取舍。
有些资料太难，作者假设学习者有一定的基础，对一些步骤进行了省略，好多初学者看了的感觉是这样的：

其实大部分人学习机器学习的目的，只要会用机器学习算法及工具，解决一些问题，了解算法的基本原理即可，并不需要学得那么深入。上面的学习路线，第一条就劝退了好多人了。没有几个人能像博士一样扎实地学好数学基础，也没有几个人能读完经典著作和热门教程，只是希望快速入门机器学习。在这种情况下，本站推荐下快速的机器学习入门路线。

二、机器学习快速入门

1.基础知识

熟悉基本的数学知识，最主要是高等数学、线性代数、概率论与数理统计三门课程，这三门课程应该是本科必修的，如果真的忘了，那就看下这篇文章：《机器学习的数学基础》，可以把这篇文章提供下载数学资料看一遍，不需要全看懂，但是基础的公式要大致明白，能从资料中查找公式，里面有两个公式总结材料：

机器学习的数学基础.docx

（中文版，对高等数学、线性代数、概率论与数理统计三门课的公式做了总结）

斯坦福大学机器学习的数学基础.pdf

（原版英文材料，非常全面，建议英语好的同学直接学习这个材料）。

本人非常建议打好数学基础，数学基础决定了机器学习从业人员的高度。

但是，如果学习时间太少，又想入门机器学习，就学习上面两个公式总结材料其中的一个。

2.机器学习的教程

机器学习入门的最佳教程

应该是吴恩达老师的《机器学习》公开课，这门课面向初学者，注重实际应用，并不侧重数学推导。这门课开课较早，但到现在仍然是最火的机器学习公开课，评分非常高，课程配套作业（octave版本）。

学习这个课程注意事项：

第五章Octave教程、第十八章应用实例，这两章可以不用学，有点过时了。

原版的octave作业可以不用做，可以做修改过的python版本作业。

如果和吴恩达老师的《深度学习》公开课一起看，第四、五、六周的内容可以直接学习《深度学习》的相关内容。

这个教程建议在三个月内看完，如果有些地方看不懂，没关系，以后用到的时候再回头看看。

这个课程建议配合课程笔记一起看。本站已经提供了笔记下载

课程的视频、笔记、python代码作业，请在这篇文章下载。

机器学习小抄

本站以前发的一篇《机器学习小抄-（像背托福单词一样理解机器学习）》

把机器学习的概念做成背托福单词的随身小抄一样方便！分分钟搞定机器学习各种记不住的概念！这篇建议用一周时间看完，注意是略读，有些地方不懂没关系，做下记录，以后用到的时候再查。

李航《统计学习方法》

详细介绍支持向量机、Boosting、最大熵、条件随机场等十个统计学习方法。对数学基础有一定要求，这是经典中的经典，很多国内的网课，互联网企业的面试、笔试题目，或多或少，参考了这本书的内容，对初学者来说，有点难度，但是，如果想通过面试笔试，这本书应该要看懂，试着推导下算法。

深度学习最佳入门教程

吴恩达《深度学习》公开课

这个****用最简单的方式，把深度学习的主要算法和框架讲得非常清楚，课程附带代码作业和测试题作业，学完以后，深度学习就算入门了。每章的学习建议：
第一章：神经网络与深度学习

部分内容是《机器学习》公开课的第四、第五周的升级版

第二章：改善深层神经网络

这部分内容基本没有和《机器学习》公开课有重合部分。

第三章：结构化机器学习项目

部分内容是机器学习的第六周的升级版。

第四章：卷积神经网络

这部分主要用于图像、目标检测方面的，相当于斯坦福CS231n深度学习与计算机视觉-李飞飞主讲的课程的简化。

第五章：序列模型

这部分主要用于自然语言处理，注意一点：RNN/LSTM结构里的符号，和原始论文有点不一样，我们平时的博客、论文的符号，跟吴恩达老师的课程的符号略有区别。

5) 李宏毅《一天读懂深度学习》讲义

台大李宏毅教授的深度学习讲义，这是我见过最容易懂的深度学习入门资料，300多页的讲义能系统、通俗易懂地讲清楚深度学习的基本原理，如同机器学习小抄一样生动形象。
建议用几天时间把这个讲义浏览一次，可以基本了解什么是深度学习，深度学习有什么用。