欢迎关注白马负金羁的博客 http://blog.csdn.net/baimafujinji,为保证公式、图表得以正确显示,强烈建议你从该地址上查看原版博文。本博客主要关注方向包括:数字图像处理、算法设计与分析、数据结构、机器学习、数据挖掘、统计分析方法、自然语言处理。


贝叶斯定理:一个例子

其实我们在之前介绍朴素贝叶斯分类器时就介绍过它,如果你有点忘了,这里就通过一个例子来帮你回忆一下。

假设有一所学校,学生中60%是男生和40%是女生。女生穿裤子与裙子的数量相同;所有男生穿裤子。现在有一个观察者,随机从远处看到一名学生,因为很远,观察者只能看到该学生穿的是裤子,但不能从长相发型等其他方面推断被观察者的性别。那么该学生是女生的概率是多少?

用事件 ) ,我们需要知道:

  • 注意,这是在没有任何其他信息下的概率。这也就是先验概率。后面我们还会详细讨论。

  • 0.6 。

  • T 事件的概率。

  • ) 是在男生中穿裤子的概率,这个值是1。

  • 0.8

根据贝叶斯公式 

)


基于以上所有信息,如果观察到一个穿裤子的学生,并且是女生的概率是 

0.25.

 


先验概率(Prior probability)

在贝叶斯统计中,先验概率分布,即关于某个变量 X 之不确定性所进行的猜测。这是对不确定性(而不是随机性)赋予一个量化的数值的表征,这个量化数值可以是一个参数,或者是一个潜在的变量。

先验概率仅仅依赖于主观上的经验估计,也就是事先根据已有的知识的推断。例如, 0.4

在应用贝叶斯理论时,通常将先验概率乘以似然函数(Likelihood Function)再归一化后,得到后验概率分布,后验概率分布即在已知给定的数据后,对不确定性的条件分布。


似然函数(Likelihood function)

似然函数(也称作似然),是一个关于统计模型参数的函数。也就是这个函数中自变量是统计模型的参数。对于观测结果 x 的值的条件分布。

似然函数在统计推断中发挥重要的作用,因为它是关于统计参数的函数,所以可以用来对一组统计参数进行评估,也就是说在一组统计方案的参数中,可以用似然函数做筛选。

你会发现,“似然”也是一种“概率”。但不同点就在于,观察值 关于观察值的函数。例如,已知一个硬币是均匀的(在抛落中,正反面的概率相等),那连续10次正面朝上的概率是多少?这是个概率。

而似然是用于在给定一个观察值时,关于描述参数的函数。例如,如果一个硬币在10次抛落中正面均朝上,那硬币是均匀的(在抛落中,正反面的概率相等)概率是多少?这里用了概率这个词,但是实质上是“可能性”,也就是似然了。


后验概率(Posterior probability)

后验概率是关于随机事件或者不确定性断言的条件概率,是在相关证据或者背景给定并纳入考虑之后的条件概率。后验概率分布就是未知量作为随机变量的概率分布,并且是在基于实验或者调查所获得的信息上的条件分布。“后验”在这里意思是,考虑相关事件已经被检视并且能够得到一些信息。

后验概率是关于参数 ) 。二者有如下关系:

  • 我们用 ),注意这也是贝叶斯定理所揭示的内容。

  • 鉴于分母是一个常数,上式可以表达成如下比例关系(而且这也是我们更多采用的形式):y


Gamma 函数

Gamma函数 ) 定义为 

t


通过分部积分法,可以很容易证明Gamma函数具有如下之递归性质 

)


也是便很容易发现,它还可以看做是阶乘在实数集上的延拓,即 

!


在此基础上,我们还可以定义Beta函数如下 

)


Beta函数的另外一种定义形式为(注意这两种定义是等价的) 

t

 


Beta 分布

之所以提到Gamma函数,那是因为在定义Beta分布时我们会用到它。Beta分布的概率密度函数(PDF)定义为: 

1


或 

1


可见,Beta分布有两个控制参数 b,而且当这两个参数取不同值时,Beta分布的PDF图形可能会呈现出相当大的差异。 

 


先验概率、后验概率以及共轭先验(转) 


Beta 分布的均值和方差分别有下面两式给出 

)

 


共轭分布

我们还是从一个例子讲起。假如你有一个硬币,它有可能是不均匀的,所以投这个硬币有 5

但上面这种点估计的方法显然有漏洞,这种漏洞主要体现在实验次数比较少的时候,所得出的点估计结果可能有较大偏差。大数定理也告诉我们,在重复实验中,随着实验次数的增加,事件发生的频率才趋于一个稳定值。一个比较极端的例子是,如果你抛出五次硬币,全部都是Head。那么按照之前的逻辑,你将估计 θ 的值等于 1。也就是说,你估计这枚硬币不管怎么投,都朝上!但是按正常思维推理,我们显然不太会相信世界上有这么厉害的硬币,显然硬币还是有一定可能抛出Tail的。就算观测到再多次的Head,抛出Tail的概率还是不可能为0。

前面介绍的贝叶斯定理或许可以帮助我们。在贝叶斯学派看来,参数 X 的条件下,我们可以得到后验概率为 

)


在上面的贝叶斯公式中,θ 很可能接近于0.8,而不大可能是个很小的值或是一个很大的值。换言之,我们在抛硬币前,便估计这枚硬币更可能有0.8的概率抛出正面。 

 


先验概率、后验概率以及共轭先验(转) 


虽然 θ 的估计了。

 

现在我们已经估计好了 2

贝叶斯公式中分母上的 θ的概率分布在[0,1]之间是连续的,所以要用积分,即 

θ


下面的证明就告诉我们:)
 依旧是个 Beta 分布!
只是这个概率分布的形状因为观测的事件而发生了变化。 

相关文章:

  • 2021-08-29
  • 2021-12-11
  • 2021-10-28
  • 2021-09-06
  • 2021-07-29
猜你喜欢
  • 2021-06-06
  • 2021-08-26
  • 2022-12-23
  • 2022-12-23
  • 2021-08-06
  • 2022-12-23
相关资源
相似解决方案