西瓜书-机器学习笔记（一）

文章目录

- - - 1 基本术语

1 基本术语

1.1 数据集

西瓜书-机器学习笔记（一）
数据集D={x1,x2,…,xm}

xm={xi1; xi2;…;xid}，是d维样本空间X中的一个样本/向量
xij是样本xi在第j个位置上的取值
d是样本xi的维数
d维样本空间X又称为样本空间/输入空间

一个模型：

1.2 预测模型-训练集

训练集=数据集+结果：{(x1,y1), (x2,y2), (xm,ym)}
例如：((色泽=青绿;根蒂=蜷缩;敲声=浊响), 好瓜)

(x1,y1)是第i个样例
yi是标记，Y是所有yi的集合，又称为标记空间/输出空间

1.3 分类与回归

预测任务是对训练集：{(x1,y1), (x2,y2), (xm,ym)}进行学习，建立从输入空间到输出空间的映射 f : X->Y

预测离散值：分类（二分类与多分类）
预测连续值：回归

1.4 聚类

自发形成簇

1.5 监督学习与无监督学习

区分标志：训练数据中是否标记信息（有标记，是监督学习；否则，是无监督）

分类、回归是监督学习
聚类是无监督学习

1.6 泛化

学得模型能够适用于新样本的能力，称为泛化能力
具有强泛化能力的模型具有能够很好地适用于所有样本空间

相关文章：

2021-11-25
2021-10-10
2021-08-03
2022-12-23
2021-06-18
2021-04-15
2022-01-04
2021-04-01

猜你喜欢

2021-12-13
2021-07-02
2021-11-19
2021-11-04
2021-12-11
2021-12-28
2022-01-15

相关资源

下载 2023-02-06
下载 2021-06-26
下载 2023-04-02
下载 2023-04-03

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode