问题的提出
一些分类问题,如果对于一些原理上就有缺陷的分类器(对,没错,就是以样本为线性可分为基础所提出的理论推导的分类器)来说,如果样本是线性不可分,那么就麻烦了。原本的理论就不适用了。但是,人们想出了一个办法,把这个问题转化的很巧妙。
人们想,是不是可以将原始空间中的点映射到一个更高维度的特征空间上去,使得样本在这个特征空间内线性可分呢?答案是可以的。貌似已经证明了如果原始空间是有限维度的,即属性是有限的,那么一定存在一个高维特征空间使得样本可分。为了更好的理解,可以看看下面这张图:
问题的解决
既然要将原始空间的点映射到高维的空间,那我们需要准备一个映射函数,姑且将整个函数名字命名为
此时我们如果想要得到高维空间中点的内积,我们很容易会写出像下面这样的公式:
其中,
这样我们就可以通过
核函数的定理
定理:核函数 令
事实上,对于一个半正定核函数,总能找到一个与之对应的映射
关于希尔伯特空间的定义,其实非常有意思,曾经看过上海交大的函数空间公开课,里面讲的很不错。所有的概念都是由距离引出来的。而各种空间都是在距离的概念上加限制条件。如何理解加限制条件呢。老师举了一个很有意思的例子。水果本身是一种定义,它具有某种属性。这是一个很广泛的基础概念。然而我们怎么定义热带水果呢?是不是在本身水果的属性或者定义的基础上,加上某些限制,例如生长在热带,才能完成热带水果的定义呢。希尔伯特空间由内积空间加完备性引出的。完备性指的是空间中的极限运算不能跑出该空间。例如你通过一个运算算出了一个不属于该空间的数,这就不属于完备性。而内积空间是由线性赋范空间(很拗口…但是就是这么叫的…)加内积运算引出的。具体的可以看看这篇文章,说的很详细
| 名称 | 表达式 | 参数 |
|---|---|---|
| 线性核 |
|
|
| 多项式核 |
|
|
| 高斯核 |
|
|
| 拉普拉斯核 |
|
|
| Sigmoid核 |
|
tanh为双曲线正切函数, |