本文转载自黄海广博士的微信公众号,链接为:添加链接描述
一、机器学习正规学习路线
如何学好机器学习?正规路线大概是这样的:
1.学好数学基础
数学分析(微积分),线性代数,概率论,统计,应用统计,数值分析,常微分方程,偏微分方程,数值偏微分方程,运筹学,离散数学,随机过程,随机偏微分方程,抽象代数,实变函数,泛函分析,复变函数,数学建模,拓扑,微分几何,渐近分析…
2.学习经典机器学习书和教程
经典书籍:Duda的《模式分类》、Mitchell的《机器学习》、李航的《统计学习方法》、周志华的《机器学习》…
吴恩达:《机器学习》公开课、《深度学习》公开课。
林轩田:《机器学习基石》、《机器学习技法》。
…
3.学好编程语言
精通Python、Java、R、MATLAB、C++等编程语言。
4.阅读论文
学好英语,熟读经典论文,并且读最新的机器学习论文,如顶级会议论文等,掌握最新的技术方向。
5.参加实际项目
如大厂实习、参加Kaggle、天池等数据竞赛…
按照以上路线学完以后,虽然不一定能成为业界大牛,博士毕业完全没有问题了。
以上方法存在的问题:
- 大部分学习者的学习目的不是为了科研,而是希望把机器学习作为工具来使用。
- 大部分学习者时间有限,学不完这么多资料,不知道如何取舍。
- 有些资料太难,作者假设学习者有一定的基础,对一些步骤进行了省略,好多初学者看了的感觉是这样的:
其实大部分人学习机器学习的目的,只要会用机器学习算法及工具,解决一些问题,了解算法的基本原理即可,并不需要学得那么深入。上面的学习路线,第一条就劝退了好多人了。没有几个人能像博士一样扎实地学好数学基础,也没有几个人能读完经典著作和热门教程,只是希望快速入门机器学习。在这种情况下,本站推荐下快速的机器学习入门路线。
二、机器学习快速入门
1.基础知识
熟悉基本的数学知识,最主要是高等数学、线性代数、概率论与数理统计三门课程,这三门课程应该是本科必修的,如果真的忘了,那就看下这篇文章:《机器学习的数学基础》,可以把这篇文章提供下载数学资料看一遍,不需要全看懂,但是基础的公式要大致明白,能从资料中查找公式,里面有两个公式总结材料:
- 机器学习的数学基础.docx
(中文版,对高等数学、线性代数、概率论与数理统计三门课的公式做了总结)
- 斯坦福大学机器学习的数学基础.pdf
(原版英文材料,非常全面,建议英语好的同学直接学习这个材料)。
本人非常建议打好数学基础,数学基础决定了机器学习从业人员的高度。
但是,如果学习时间太少,又想入门机器学习,就学习上面两个公式总结材料其中的一个。
2.机器学习的教程
- 机器学习入门的最佳教程
应该是吴恩达老师的《机器学习》公开课,这门课面向初学者,注重实际应用,并不侧重数学推导。这门课开课较早,但到现在仍然是最火的机器学习公开课,评分非常高,课程配套作业(octave版本)。
学习这个课程注意事项:
第五章Octave教程、第十八章应用实例,这两章可以不用学,有点过时了。
原版的octave作业可以不用做,可以做修改过的python版本作业。
如果和吴恩达老师的《深度学习》公开课一起看,第四、五、六周的内容可以直接学习《深度学习》的相关内容。
这个教程建议在三个月内看完,如果有些地方看不懂,没关系,以后用到的时候再回头看看。
这个课程建议配合课程笔记一起看。本站已经提供了笔记下载
课程的视频、笔记、python代码作业,请在这篇文章下载。
- 机器学习小抄
本站以前发的一篇《机器学习小抄-(像背托福单词一样理解机器学习)》
把机器学习的概念做成背托福单词的随身小抄一样方便!分分钟搞定机器学习各种记不住的概念!这篇建议用一周时间看完,注意是略读,有些地方不懂没关系,做下记录,以后用到的时候再查。
- 李航《统计学习方法》
详细介绍支持向量机、Boosting、最大熵、条件随机场等十个统计学习方法。对数学基础有一定要求,这是经典中的经典,很多国内的网课,互联网企业的面试、笔试题目,或多或少,参考了这本书的内容,对初学者来说,有点难度,但是,如果想通过面试笔试,这本书应该要看懂,试着推导下算法。
- 深度学习最佳入门教程
吴恩达《深度学习》公开课
这个****用最简单的方式,把深度学习的主要算法和框架讲得非常清楚,课程附带代码作业和测试题作业,学完以后,深度学习就算入门了。每章的学习建议:
第一章:神经网络与深度学习
部分内容是《机器学习》公开课的第四、第五周的升级版
第二章:改善深层神经网络
这部分内容基本没有和《机器学习》公开课有重合部分。
第三章:结构化机器学习项目
部分内容是机器学习的第六周的升级版。
第四章:卷积神经网络
这部分主要用于图像、目标检测方面的,相当于斯坦福CS231n深度学习与计算机视觉-李飞飞主讲的课程的简化。
第五章:序列模型
这部分主要用于自然语言处理,注意一点:RNN/LSTM结构里的符号,和原始论文有点不一样,我们平时的博客、论文的符号,跟吴恩达老师的课程的符号略有区别。
5) 李宏毅《一天读懂深度学习》讲义
台大李宏毅教授的深度学习讲义,这是我见过最容易懂的深度学习入门资料,300多页的讲义能系统、通俗易懂地讲清楚深度学习的基本原理,如同机器学习小抄一样生动形象。
建议用几天时间把这个讲义浏览一次,可以基本了解什么是深度学习,深度学习有什么用。