3.1 k近邻法算法

对于一个尚未分类的实例,在数据集中找到与这个实例最接近的k个实例,之后将该未分类实例归入k个实例中其所在最多的那个类别

输入:数据集T;类别向量;待分类实例x
输出:x所在的类别
实现过程如下:
(1) 根据距离向量的指示,找到距离该实例最近的k个实例
(2) 在这k个实例中,根据分类决策规则(如多数表决)决定x的类别
《统计学习方法》 - k近邻法

3.2 k近邻法模型

其模型是对特征空间的划分,每个实例点对应的k个实例成为单元(cell)
k近邻法模型的三要素为:距离向量;k的取值;分类决策规则

3.2.1 距离向量

《统计学习方法》 - k近邻法
《统计学习方法》 - k近邻法

3.2.2 k值的选择

k值如果过小,就会使模型更为复杂,并对邻近实例的敏感度增加,如果恰好邻近实例是噪声,就会导致错误的结果或者过拟合;k值如果过大,使模型过为简单,从而忽略了实例中大量的有用信息
通常用交叉验证法选取最优的k值


3.2.3 分类决策规则

《统计学习方法》 - k近邻法

3.3 k近邻法的实现:kd树

3.3.1 构造kd树

《统计学习方法》 - k近邻法
《统计学习方法》 - k近邻法

3.3.2 搜索kd树

《统计学习方法》 - k近邻法
《统计学习方法》 - k近邻法


相关文章:

  • 2021-07-06
  • 2021-12-27
  • 2021-09-23
  • 2021-06-13
  • 2021-07-31
  • 2021-05-17
  • 2021-08-20
  • 2021-05-27
猜你喜欢
  • 2021-05-18
  • 2021-04-25
  • 2021-06-14
  • 2021-09-24
  • 2021-09-10
  • 2022-12-23
  • 2021-10-17
相关资源
相似解决方案