还没怎么真正理解,仅为自己记录下,后期还会继续完善!
给定训练样本集合,其中每个样本有两个可选的label(+1, -1)。因此总共有
种不同的label组合。如果对于其中每一种组合,分类模型 f 都能够对其进行正确的划分,那么我们称 f 能够将训练样本集合
打散(shatter)。
举例来看,下图共有3个样本,可以看到,对于样本的任意一种label组合,图中的直线都可以将正样本和负样本分开。这时我们称这条直线可以将这三个样本打散(shatter)。
再来一个不能打散的例子:
上图中显示了四个样本,如果只用一条直线,那么无论这条直线怎么划都不能将正负样本分开。不仅仅是上图,随便画四个点都做不到。
对于上面的例子,d=2,存在三个样本,其任意label组合都可以被一条直线正确地划分,而不存在四个样本能被一条直线打散,因此2维平面的VC维是3。
下面是西瓜书上的讲解: