【问题标题】:random sampling and probability随机抽样和概率
【发布时间】:2018-07-11 23:15:42
【问题描述】:

提前抱歉,因为我的问题更多的是统计数据而不是编程。但是,我需要进一步实施的答案。 考虑我们有 N 条记录,其中 X 条具有特定特征。我们从 N 中随机选择 n 条记录(无放回抽样)。样本 n 中出现 X 条记录的概率是多少?或者当涉及到较小的 n 组时,X 会变得多小?

例如:N = 40,000,000 X = 20,000 n = 25,000,000

【问题讨论】:

  • 我认为这可能与概率教科书中的红球和绿球问题之一同构。无论如何,我认为 stats.stackexchange.com 可能有更多要说的。
  • 我投票结束这个问题,因为它是关于统计数据,而不是编程。

标签: random probability sampling


【解决方案1】:

不就是Hypergeometric Distribution的例子吗?

如果随机变量 X 的概率质量函数 (pmf) 由下式给出,则 X 服从超几何分布

P(X=k) = C(K, k)*C(N-K, n-k)/C(N, n)

在哪里

  • N 是人口规模,
  • K 是总体中成功状态的数量,
  • n 是抽奖次数,
  • k 是观察到的成功次数,
  • C(a, b) 是二项式系数。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-11-26
    • 1970-01-01
    • 1970-01-01
    • 2015-06-08
    • 1970-01-01
    相关资源
    最近更新 更多