【问题标题】:Sampling from discrete probability distribution from first principles从第一原理的离散概率分布中抽样
【发布时间】:2012-05-27 18:46:26
【问题描述】:

我有一个集合 S={a1,a2,a3,a4,a5,......,an}。选择每个元素的概率分别为 {p1,p2,p3,p4,p5,...,pn}(其中 p1+p2+p3+p4+p5+....+pn=1} .

我想模拟一个可以做到这一点的实验。但是我希望在没有任何库的情况下做到这一点(即从第一原则)

我正在使用以下方法:1)我将实数线上的元素映射如下X(a1)= 1; X(a2)=2; X(a3)=3; X(a4)=4; X(a5)=5;....,X(an)=n

2) 然后我计算每个坐标的累积概率分布函数(即 P(x

(因此 cdf 是一个阶跃函数)

3) 我随机选择一个实数,q 介于 (0,1) 之间。并计算线 y = q 与 cdf 相交的 x 坐标。由于 cdf 是在 1,2,...n 处跳跃的阶跃函数,因此该点将具有整数 x 坐标 btw 1 和 n。设 x 坐标为 m。

4) 我选择那个 ai,使得 X(ai) = m。

我的问题是这种方法是否在没有任何偏差的情况下模拟实验?

我没有得到所需的结果,这就是为什么我有点怀疑。

任何帮助将不胜感激!谢谢!

【问题讨论】:

标签: statistics probability sampling


【解决方案1】:

逻辑听起来不错。一般要从均匀分布U(0,1)中采样任意分布函数Y(x),只需在Y向量中查找均匀随机值u,返回Y(x)大于等于的x的最小值你即min{x:Y(x)>=u}

您可能希望为基本概率添加 x=0 观察值,如下例所示。

x      P(x)    Y(x)
0      0       0
1      0.1     0.1
2      0.3     0.4
3      0.4     0.8
4      0.2     1

例如u = 0.3 -> x = 2u = 0.81 -> x = 4

清楚地计算多次试验的相对频率将给出 P(x) 的无偏估计。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2012-04-14
    • 2016-06-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-08-16
    • 2015-12-08
    相关资源
    最近更新 更多