【问题标题】:How to make a sample from the empirical distribution function如何根据经验分布函数制作样本
【发布时间】:2017-07-21 08:27:35
【问题描述】:

我正在尝试在 Python 上实现非参数引导。它需要抽取一个样本,从中建立一个经验分布函数,然后从这个 edf 中生成一堆样本。我该怎么做? 在 scipy 中,如果您知道描述它的确切公式,我只发现如何制作自己的分布函数,但我只有一个 edf。

【问题讨论】:

  • 为什么需要 EDF?你应该从你的数据中采样(替换),这些将是你的引导样本

标签: python scipy statistics statistics-bootstrap


【解决方案1】:

通过对样本进行排序得到的 edf:

N = samples.size
ss = np.sort(samples) # these are the x-values of the edf
                      # the y-values are 1/(2N), 3/(2N), 5/(2N) etc.
edf = lambda x: np.searchsorted(ss, x) / N

但是,如果您只想重新采样,那么您只需以相等的概率和替换从您的样本中抽取。

如果您不喜欢这太“阶梯式”,您可能可以使用某种插值来获得平滑分布。

【讨论】:

  • EDF 按定义 steppy !
  • @maxymoo 是的,我知道。但通常人们对 edf 本身并不真正感兴趣,而是将其作为一种估计“真实”分布的设备。人们可能有充分的理由假设真实分布是平滑的。此外,根据您使用新样本的目的,从真实分布平滑的离散分布中采样很可能会导致伪影。
  • 这很有趣......你经常平滑你的引导程序吗?
  • @maxymoo 幸运的是,我的日常生活不需要太多统计数据。为什么,你有任何原则性的反对意见吗?我总是乐于聆听卓越的知识。
  • 大声笑“幸运的是”不,我绝对没有高超的知识或任何原则性的反对意见,我在这里学到了一些东西,如果我在我的引导程序中观察到人工制品,将来会记住平滑技巧.
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2023-01-26
  • 2020-02-29
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-09-11
  • 2014-12-02
相关资源
最近更新 更多