《统计学习方法》 - k近邻法

对于一个尚未分类的实例，在数据集中找到与这个实例最接近的k个实例，之后将该未分类实例归入k个实例中其所在最多的那个类别

输入：数据集T；类别向量；待分类实例x

输出：x所在的类别

实现过程如下：

（1）根据距离向量的指示，找到距离该实例最近的k个实例

（2）在这k个实例中，根据分类决策规则（如多数表决）决定x的类别

其模型是对特征空间的划分，每个实例点对应的k个实例成为单元（cell）

k近邻法模型的三要素为：距离向量；k的取值；分类决策规则

k值如果过小，就会使模型更为复杂，并对邻近实例的敏感度增加，如果恰好邻近实例是噪声，就会导致错误的结果或者过拟合；k值如果过大，使模型过为简单，从而忽略了实例中大量的有用信息

通常用交叉验证法选取最优的k值