【问题标题】:Distribution Function exact and approximated?分布函数精确和近似?
【发布时间】:2021-12-13 21:46:39
【问题描述】:

我正在用 R 做一些统计练习,只剩下一个问题我做不到。

X1, X2, \dotsc, Xk 是与 X 同分布的独立随机变量,参数 Lambda=8 的泊松分布。使用 R 并在 1284 中固定一个种子,生成一个大小为 55 的样本,随机变量 S38=∑I 到 38 Xi 的精确分布

基于 ggplot2 构建与该样本相关的经验分布函数图。在同一个情节中(用不同的颜色):

A. S38的精确分布函数

B. S38对正态分布的近似分布函数

我要做的是创建 38 个近似于 Poisson(8) 分布的变量并求和以创建 S38?此外,确切的分布是该创建变量的直方图吗?那么S38到Normal的近似分布函数呢?

【问题讨论】:

  • 您显然必须对每个 $\text{Poisson(8)}$ 的 $38$ 个随机变量进行采样和求和,然后将它们相加,这样做 $55$ 次,因此给出 $55$ 的值,然后绘制这些值的经验累积分布函数。最重要的是,您需要绘制 a) $38$ $\text{Poisson(8)}$ 随机变量之和的理论累积分布函数和 b) 具有相同均值的正态分布的理论累积分布函数和方差如(a)

标签: r


【解决方案1】:
set.seed(1284)
s.38 = replicate(55, sum(rpois(38,8)))
summary(s.38)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  274.0   292.5   304.0   306.3   315.0   371.0 
length(s.38);  var(s.38)
[1] 55
[1] 360.9212

hist(s.38, prob=T, col="skyblue2");  rug(s.38)
 curve(dnorm(x, 304, sqrt(304)), add=T, 
         col="red", lwd=2, lty="dotted")

我故意不使用 ggplot2,把那部分留给你。 下面是与不太优雅的 R 核心图形类似的东西。 下图显示了 $S_{38}.$

的经验 CDF (ECDF)

s.38 来自哪个离散分布的随机样本? 您应该在相同的轴上绘制其精确的 CDF。

@Henry 所说的正态分布是什么,为什么? 我显示(红色虚线)正态分布的 CDF。 不管它是什么,它似乎确实近似于 $S_{38}.$

的 ECDF
plot(ecdf(s.38))
 curve(pnorm(x, 304, sqrt(304)), add=T, 
        col="red", lwd=2, lty="dotted")

注意:对于少至 55 个观测值的样本,数据的 ECDF 通常看起来更好 与人口 CDF 匹配,而不是数据直方图与人口 PDF 匹配。 (当数据丢失时,一些信息会丢失 分箱以制作直方图。)

【讨论】:

    猜你喜欢
    • 2021-10-10
    • 2020-01-23
    • 2021-03-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-03-20
    • 1970-01-01
    • 2022-07-08
    相关资源
    最近更新 更多