由于概率论在模式识别中占有举足轻重的位置,所以这章就专门讲一讲几个典型的概率分布和它们的性质。另外还涉及一些简单的统计学概念。

概率分布就是给p(x)建立模型,又称为密度估计(density estimation)。说到底也就是个建模,所以每一个模型都是不适定的,模型也有无限多可能性,选取合适的模型就成立模式识别中的一个重要议题。

这无限多的模型可以被分成两大类:parametric distribution与nonparametric distribution

parametric distribution:
之所以这么叫是因为它们的表现好坏是由一系列参数控制的,比如高斯分布中的u与那个方差。
确定这种分布要由给定数据确定参数值。


常见的做法有:
找到参数使某某值最小等(likelihood function),最优化那个做法。
贝叶斯做法,通过给定数据、先验分布确定后验分布。
其中贝叶斯做法中一类特殊情况可以大大简化分析过程,即为conjugate priors。都属于exponential family of distribution 

缺点:参数分布的缺点是提前已经确定了分布函数的框架了,对一些特定的情况不合适。有局限性。

nonparametric distribution:

分布的模式只与数据集的大小有关,其中的参数也只是确定复杂度用的。

相关文章:

  • 2022-03-02
  • 2021-06-17
  • 2021-09-19
  • 2021-12-29
  • 2021-05-22
  • 2021-05-09
  • 2021-06-26
  • 2021-08-20
猜你喜欢
  • 2021-09-25
  • 2022-12-23
  • 2021-06-21
  • 2021-10-18
  • 2021-10-01
  • 2021-07-12
  • 2022-02-18
相关资源
相似解决方案