http://www.rustle.us/?p=167
概率分布之间的关系是个有趣的话题。若要一张图简要概述概率分布之间的关系,下图是经典。本文将从上到下,从左到右解释这张图。本来要全部写完才发布的。不过考虑到明天就回家了,家里没有网肯定写不了,所以先发布一部分,剩余部分国庆之后补上。另外求该图的原始出处。
1. )。多项分布的项数等于二,则变成二项分布。
2.
则 (1)
后面推不下去了(囧里个囧)。等我有能力看懂文献1,再补全。
3. ) 。Negative
Binomial描述这样的场景:我们不停地做抛银币实验,每次正面概率为θ。我们经历了第X次反面之后得到第r次正面,
则X符合Negative Binomial分布。易知概率公式如下所示
因为
4.
历史上,泊松分布是这样推导出来的。实际上,我们可以这么理解:1个小时内通过某个路口的车辆数符合泊松分布。1个小时是由60分钟内组成的,每分钟通过某个路口的车辆数也满足泊松分布。1分钟是由60秒内组成的,每秒通过某个路口的车辆数也满足泊松分布。。。但是,当我们不停的细分下去,一段时间变成无数多个时刻之后,每个时刻只能以一定概率通过一辆车(一个时刻只能通过一辆)。这时通过的汽车数就变成n为无穷的二项分布了。
5. ) 。二项分布的每次实验都是伯努利实验。
6. ) 。泊松分布近似正态分布。在证明这个近似之前,我们先介绍一个统计学上个概念,Moment Generation Function (MGF)。随机变量
MGF有一个重要的性质:如果两个分布的MGF相等,则这两个分布是相同的。因此,只要我们证明泊松分布的MGF趋近于正态分布的MGF,就证明泊松分布近似正态分布。泊松分布
正态分布的MGF:
根据公式u时,泊松分布的MGF近似于正态分布的MGF,因此泊松分布近似于正态分布。
7. )。 这里我们需要用到中心极限定理。 假设X_1,X_2,...,X_n是服从任意分布的独立同分布样本,0, 则随着)。 我们进行n次成功的概率为
而根据中心极限定理,随着n趋近无穷, (9)
综合公式9便可得到结论。
8. )。标准正态分布和一般正态分布的关系。
9. )。正态分布是多元正态分布的一种特例。
10. )表示自由度为n的Student t分布。Student t-分布可简称为t分布。其推导由威廉·戈塞于1908年首先发表,当时他在酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student)这一笔名。之后t检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为Student t 分布。
如果
我们先处理t分布公式的前半部分。先假设n为偶数的情况,即
我们接着处理t分布公式的后半部分。
综合公式12,得出结论:当n很大时,t分布近似于标准正态分布。
11.
12. )。
卡方分布是Gamma分布的一种特殊形式。Gamma分布的概率密度公式:
需要说明的是,原图的转化条件有错。正确的转化条件是2, 而不是2。
13. ), 其中2, 根据中心极限定理, 随着
因此我们很容易得出:
需要说明的是,原图的转化条件有错。正确的转化条件是∞, 而不是∞。写到这,我回过味来了,难道是原图中的Gamma分布用了不一样的形式? 满地打滚,再次求原图的出处!
1 Teerapabolarn, K. "A bound on the binomial approximation to the beta binomial distribution." International Mathematical Forum. Vol. 3. No. 28. 2008.