2.1数据驱动
2.1数据驱动
1搜集图像和标签的数据集
2用机器学习训练分类器
3用新图像评估分类器

曼哈顿距离

2.1数据驱动
2.1数据驱动
对图片中单个像素进行比较,假设我们呢的图片是4*4。左上角的图像减去训练图像对应像素的值,然后取绝对值,得到两幅图像的像素的差距
最邻近法的python代码
2.1数据驱动
当有N个例子时训练和预测的速度有多快?
训练O(1),预测O(N)
训练时候我们不需要做任何事,只需要存储数据,如果你只是复制一个指针,无论你的数据集多大,都将是一个恒定的时间,但在测试时候需要停下来,与我们测试图像进行比较,这个过程很慢。
这不符合我们需要,我们需要训练时间慢,测试快,从这个角度最临近法有些落后了。

最近邻算法

2.1数据驱动
我们画了一个图形,叫他最近邻分类器的决策区域,我们训练集包含二维画面的这些点,点的颜色代表不同的类别或不同的标签。
对整幅图像的每个点来说,我们将计算这些训练数据中最近的实例。
这个分类器不是一个好的选择。
图像中部集中了大部分绿色的点,但中心却又黄点,因为只计算最接近的点,所以在绿色区域中间,这个黄点被分割,但或许它应该是绿色的。
从这个契机出发,我们产生了k-邻近算法,不只寻找最近的点,根据距离度量找到k个最近的点。然后再这些相邻点中投票,这些票多的近邻点,预测出结果。
2.1数据驱动

相关文章: