Eliezer Yudkowsky 有一个(真的,真的很长,但很好)explanation of Bayes' Theorem。大约下降了 70%,有一段以“在你面前是一个书包”开头,说明了这个问题的核心。
关键是,重要的是有多少红球和白球之间的差异。因此,与其他人所说的相反,您不必进行任何计算。 (这是做出合理的假设之一:(a)球被抽出替换,或者(b)骨灰盒中有很多球。那么球无关紧要。)这是论点:
回忆贝叶斯定理:P(A|B) = P(B|A) * P(A) / P(B)。 (关于术语的注释:P(A) 是 prior 而 P(A|B) 是 posterior。B 是您所做的一些观察,术语反映了您的before 和 after 你的观察。)这种形式的定理很好,@bobince 和 @Adam Rosenfield 正确地应用了它。但是,直接使用这种形式会使您容易受到算术错误的影响,并且它并不能真正传达贝叶斯定理的核心。亚当在他的帖子中提到(我在上面提到过),重要的是绘制了多少个红球和白球之间的差异,因为“其他一切都在方程式中抵消了”。不做任何计算我们怎么能看到呢?
我们可以使用优势比和似然比的概念。什么是优势比?好吧,我们不会考虑 P(A) 和 P(¬A),而是考虑它们的比率 P(A) : P(¬A)。任何一个都可以从另一个中恢复,但是算法在优势比上效果更好,因为我们不必进行标准化。此外,更容易“得到”贝叶斯定理的另一种形式。
我的意思是我们不必规范化,另一种形式是什么?好吧,让我们计算一下。贝叶斯定理说后验概率是
P(A|B) : P(¬A|B) = (P(B|A) * P(A) / P(B)) : (P(B|¬A) * P(¬A ) / P(B))。
P(B) 是使概率总和为 1 的归一化因子;但是,我们正在使用比率,其中 2 : 1 和 4 : 2 的几率是相同的,所以 P(B) 取消了。我们只剩下一个简单的表达式,它恰好是因数:
P(A|B) : P(¬A|B) = (P(B|A) * P(A)) : (P(B|¬A) * P(¬A)) = (P (B|A) : P(B|¬A)) * (P(A) : P(¬A))
我们已经听说过那里的第二个任期;这是先验优势比。什么是 P(B|A) : P(B|¬A)?这称为似然比。所以我们的最终表达式是
后验概率 = 似然比 * 先验概率。
我们如何在这种情况下应用它?好吧,假设我们有一些先验概率 x : y 表示瓮中的东西,其中 x 代表 2/3 红色,y 代表 2/3 白色。假设我们画了一个单个红球。似然比是 P(drew red ball | urn is 2/3rds red) : P(drew red ball | urn is 2/3rds white) = (2/3) : (1/3) = 2 : 1. 所以后验赔率是 2x : y;如果我们画了一个白球,通过类似的推理,后验概率将是 x : 2y。现在我们对每个球按顺序执行此操作;如果平局是独立的,那么我们只需将所有优势比相乘。因此,如果我们以 x : y 的优势比开始并绘制 r 个红球和 w 个白球,我们得到的最终优势比为
(x : y) * (2 : 1)^r * (1 : 2)^w = (x * 2^r) : (y * 2^w) = (x : y) * (2^ (rw) : 1).
所以我们看到重要的是r和w之间的区别。它也让我们轻松解决问题。对于第一个问题(“谁应该更有信心?”),先验几率无关紧要,只要它们不是 1 : 0 或 0 : 1 并且两个人都有相同的先验。确实,如果他们相同的先验是 x : y,那么第一个人的后验是 (2^3 * x) : y,而第二个人的后验是 (2^4 * x) : y,所以第二个人更当然。
此外假设先验概率是一致的,即 1:1。那么第一个人的后验概率是 8:1,而第二个人的概率是 16:1。我们可以很容易地将这些概率转换为 8/9和 16/17,确认其他计算。
这里的重点是,如果你得到上面的粗体方程,那么这个问题真的很容易。但是同样重要的是,你可以确定你没有搞砸任何算术,因为你必须做的很少。
所以这是一个糟糕的编程问题,但它是对粗体方程的一个很好的测试。只是为了练习,让我们将其应用于另外两个问题:
我随机选择两个硬币中的一个,一个公平的硬币或一个假的双头硬币,每个都有 50% 的概率。我把它翻了三遍,三遍都是正面。它是真币的概率是多少?
如问题中所述,先前的赔率是真实的:fake = 1 : 1。我看到真币三个正面的概率是 1 / 8,但假币是 1,所以似然比是 1:8。所以后验概率是 = 先验 * 似然 = 1:8。因此它是真币的概率是 1 / 9。
这个问题也带来了一个重要的警告:每个可能的观察都有一个可能不同的似然比。这是因为 B 的似然比是 P(B|A) : P(B|¬A),这不一定与 ¬B 的似然比有关,即 P(¬B|A) : P(¬ B|¬A)。不幸的是,在上面的所有示例中,它们都是彼此相反的,但在这里,它们不是。
确实,假设我掷硬币一次,得到反面。它是真币的概率是多少?显然是一个。贝叶斯定理如何检验?嗯,这个观察的似然比 是用真币和假币看到这个结果的概率,即 1/2 : 0 = 1 : 0。也就是说,看到一个 单尾消除了硬币是假的可能性,这符合我们的直觉。
这是我在 Eliezer 页面中提到的问题:
你面前是一个书包,里面装着 1000 个扑克筹码。我从两个这样的书包开始,一个包含 700 个红色和 300 个蓝色筹码,另一个包含 300 个红色和 700 个蓝色筹码。我掷了一个公平的硬币来决定使用哪个书包,所以你面前的书包是红色书包的先验概率是 50%。现在,您随机抽样,在每个芯片后更换。在 12 个样本中,您得到 8 个红色和 4 个蓝色。这是主要是红色的袋子的概率是多少? (您不需要精确 - 粗略的估计就足够了。)
先验几率是红色:蓝色 = 1:1。似然比是 7:3 和 3:7,因此后验几率是 (7:3)^8 * (3:7)^4 = 7^ 4:3^4。此时我们只是将 7 : 3 估计为 2 : 1,得到 2^4 : 1 = 16 : 1。我们最终的答案更大,所以肯定大于 95% 左右;正确答案约为 96.7%。将此与大多数人的答案进行比较,后者在 70--80% 范围内。
我希望你同意,从这个角度来看,问题变得非常容易,并且直观。