总算可以踏踏实实的学习机器学习了,作者希望未来的研究方向是数据科学,但是碍于专业课的阻碍,一直没能系统的学习相关内容,如今有了充足的时间,希望我能在这个方向上能有所建树。

注:本系列内容属于机器学习入门,是作者在跟着慕课视频学习的一些总结性笔记,偏向于算法的原理以及技术实现,只包含基础的机器学习算法,不涵盖神经网络和深度学习,且不包括真实世界数据。

技术栈:Python3、scikit-learn、numpy、matplotlib

数学要求:本科高数、线代、概率论及格

机器学习基础概念:

数据:

数据集:数据整体。
样本:每一个种类的所有数据(特征)
特征:样本的某个特定属性
数据的种类:一般用0、1、2表示

【机器学习入门】1、了解机器学习
大写字母X:数据矩阵
小写y:标记,(一般小写表示向量,大写表示矩阵)
【机器学习入门】1、了解机器学习
向量:行向量(样本行)、列向量(特征列),其中以列向量较多

特征空间:根据特征画出的散点图,分类本质任务就是在特征空间切分

抽象特征:如图像,每一个像素点都是特征

机器学习的基本任务

分类任务:二分类(如判断是猫还是狗)、多分类(如手写识别、数字识别、图像识别、围棋,多分类任务可转化为二分类)、多标签分类(图片中的物体种类划分)。

回归任务
【机器学习入门】1、了解机器学习
结果是一个连续数字的数值,而非类别,比如预测学生成绩。
一些情况下,回归任务可简化成分类任务,如预测学生成绩的评级(A、B等)

现在可以引入机器学习的概念图
【机器学习入门】1、了解机器学习

模型:可理解为函数,机器学习主要就是建立模型。

相关文章: