目录
简单随机抽样:
似然函数:
- 给定联合样本值x关于参数θ的函数:
其中x是随机变量X取得的值,θ是未知的参数。
-
是密度函数,表示给定θ下的联合密度函数。
- 似然函数是关于θ的函数而密度函数是关于x的函数。
极大似然估计:
设甲箱中有99个白球,1个黑球;乙箱中有1个白球.99个黑球。现随机取出一箱,再从抽取的一箱中随机取出一球,结果是黑球,这一黑球从乙箱抽取的概率比从甲箱抽取的概率大得多,这时我们自然更多地相信这个黑球是取自乙箱的。一般说来,事件A发生的概率与某一未知参数
有关,
取值不同,则事件A发生的概率
也不同,当我们在一次试验中事件A发生了,则认为此时的
值应是t的一切可能取值中使
达到最大的那一个,极大似然估计法就是要选取这样的t值作为参数t的估计值,使所选取的样本在被选的总体中出现的可能性为最大
我们的数据是来源于真实的,那就一定符合一个正态分布,只不过我们不知道这个分布得μ是多少。当调节μ的大小使得所有样本点概率乘积最大时,说明此时最符合实际情况对应的θ就是真实μ的估计值了。
随机事件:
- 可以在相同条件下重复执行
- 事先就能知道可能出现的结果
- 试验开始前并不知道这一次的结果
条件概率:
P(B|A)与P(AB)
- 相同点:事件A,B都发生了
- 不同点:样本空间不同:在P(B|A)中,事件A成为样本空间;在P(AB)中,样本空间仍为Ω 。
独立性
例题:甲、乙两人同时向一目标射击,甲击中率为0.8,乙击中率为0.7,求目标被击中的概率
-
重复独立试验:在相同的条件下,将试验E重复进行,且每次试验是独立
进行的,即每次试验各种结果出现的概率不受其他各次试验结果的影响。 -
n重伯努利试验:若一试验的结果只有两个A和Ā, 在相同的条件下, 将试验独立
地重复进行n次, 则称这n次试验所组成的试验为n重复伯努利试验或伯努利概型。
二维随机变量:
- 二维随机变量的联合函数:若(X,Y)是随机变量,对于任意的实数x,y
- F(x,y)表示随机点(X,Y)在以(x,y)为顶点且位于该点左下方无穷矩形内的概率。
- 用联合分布函数F(x,y)表示矩形域概率
边缘分布:
边缘分布函数:二维随机变量(X,Y)作为整体,有分布函数 其中,X和Y都是随机变量,它们的分布函数记为: 称为边缘分布函数。
F(x, y),FX(x), FY(y)
由联合分布函数可以得到边缘分布函数:
- 离散型的边缘分布
- 连续型的边缘概率密度
期望:
- 离散型随机变量,若级数
绝对收敛,则称其为随机变量X的数学期望
- 连续型随机变量,则称积分的值
为随机变量X的数学期望
二维情况下的期望求值:
- 离散型:若 (X, Y) ~ P{X=xi,Y=yj,}= pij, i, j=1, 2, … , 则Z= g(X,Y)的期望
- 连续型:若二维连续型随机变量X ,Y 的概率密度为:z = g(x,y)
要注意是对什么求期望 如下题:
期望计算性质的应用:
马尔科夫不等式:
方差:数学期望反映了随机变量的取值水平,衡量随机变量相对于数学期望的分散程度则的另一个数字特征。
大数定理:在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。
切比雪夫不等式:
应用:
中心极限定理:样本的平均值约等于总体的平均值。不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体的整体平均值周围,并且呈正态分布。
后验概率估计
先验概率:通过以往经验或者理论上的事件的概率,比如在你抛硬币之前我先告诉你正面朝上的概率为0.5
之前都是拿到实验数据后根据极大似然估计法来求参数,现在要综合考虑先验概率的影响。
贝叶斯拼写纠错实例
p(D)实际输入某数的概率,对于任何h来说都是一致的,所以当作常数处理。
垃圾邮件过滤实例
p(h+)和p(h-)只要计算垃圾邮件和非垃圾邮件在总邮件库中的概率是多少即可,