机器学习第四章

思维导图

4.1线性判据基本概念

生成模型：直接在输入空间中学习其概率密度p(x)

判别模型：直接在输入空间输出后验概率p(Ci|x)

线性判据：如果判别模型f(x)是线性函数，那f(x)为线性判据
对于二分类，决策边界是线性；对于多分类，相邻两类的决策边界也是线性
计算量少，适用于样本少的情况
线性判据模型：f(x) = wTx + w0
任意样本x到决策边界的垂直距离：r = f(x) / ||w||。

4.2线性判据学习概述

监督式学习(训练)过程（学习w和w0）

识别过程

解不唯一；
参数空间&解域（从解域中找到最优解）；
- 设计目标函数 + 约束条件（提高泛化能力）
- 最大/最小化目标函数
约束条件
- 使得解域范围收缩

4.3并行感知机算法

预处理：参数合一，负类样本取反
目标函数是被错误分类的所有训练样本的输出取反求和。
目标函数求偏导后不含参数w和w0，故使用梯度下降迭代求解最优，需要设置步长、阈值，和初始化w和w0，当目标函数小于阈值或者大于等于0后，停止。

4.4串行感知机算法

并行感知机算法一次全部给出训练样本

串行感知机算法一个一个串行给出训练样本
思想：当前样本被错误分类的程度最小。
目标函数
收敛性、全局最优&局部最优
感知机变体 b的作用：避免出现a=0的解

4.5Fisher线性判据

原理：找到一个合适的投影轴，使得两类样本在轴上重叠部分最少

类间差异程度尽可能大、类内离散程度尽可能小
类间样本用均值差度量、类内样本用协方差矩阵度量
存在问题：两类部分样本在决策边界附近犬牙交错

4.6支持向量机基本概念

基本思想：给定一组训练样本，两个类与决策边界最近的训练样本到决策边界的间隔最大。
间隔
支持向量机(SVM)：最大化总间隔。

4.7拉格朗日乘数法

用于解决条件优化问题
- 等式约束中g(x) = 0的条件，使得λ可正可负，f(x)和g(x)的梯度方向一定平行，但方向可能同向或者反向，且梯度幅值不同。
- 不等式约束分为两种情况：
  - 一种是极值点在可行域内，即g(x) < 0，则必有λ=0；
  - 一种是极值点落在可行域边界，即λ大于0，故f(x)的梯度方向将和g(x)平行且相反

4.8拉格朗日对偶问题

不等式约束仍然带有约束条件，如何优化求解？
引入主问题，仍然难以求解
引入对偶函数，主问题最优值的下界

4.9支持向量机学习算法

带不等式约束的优化问题使用拉格朗日对偶法求解
构造拉格朗日函数、构建对偶函数、对偶问题的求解（二次规划问题、参数最优解w、w0）
支持向量机分类器

4.10软间隔支持向量机

软间隔：克服过拟合
允许在一定程度上，让训练样本出现在间隔区域内
引入松弛变量

松弛变量的大小决定了错误分类的程度
引入正则系数
构建拉格朗日函数、对偶函数（在极值点得到）、求解参数w和w0最优解

4.11线性判据多类分类

多类分类的本质：非线性

多个模型（线性/非线性）组合成非线性决策边界
策略
- One-to-all：假设每个类与剩余类可分
  - K个类、K-1个分类器
  - 正负样本个数不均衡？存在混淆区域问题？
- 线性机：假设每个类与剩余类线性可分。
  - 使用输出值投票法（max函数）给定测试样本

相关文章：

猜你喜欢

相关资源

Go 学习笔记第四版雨痕著pdf[1.31MB]下载 2022-12-18
Python 学习笔记第四版中文pdf高清版下载 2023-03-28
汇编程序格式(第四章) ppt版下载 2023-03-30
机器学习训练秘籍 (Machine Learning Yearning) 完整版PDF下载 2023-02-16

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode