【问题标题】:Statistical estimation algorithm统计估计算法
【发布时间】:2009-04-26 15:20:09
【问题描述】:

我不确定这个问题是否适合 Stack Overflow,但无论如何我都会尝试一下。 我有一些数据如下:

我还有另一组数据,我认为它们遵循类似的分布,但我只知道总百分比(例如 30% 而不是 17%。)任何人都可以建议一种算法来估计每个单独层的 %s新的总百分比和原始分布?

【问题讨论】:

  • 这是一个很好的问题。不过,我会编辑您的测试并删除您的第一句话。问题的前几句以工具提示或预览的形式显示,因此您应该放弃形式,直接进入正文。
  • 可能的总数应该保持不变吗?
  • 我真的不清楚您要做什么。如果您能详细解释所有测量值的含义、您拥有的测量值以及您想要估算的具体值,我会尝试回答您的问题。
  • 我认为这不是一个 SO 问题。真的和编程无关。问这个问题的更好的地方可能是像 sci.stat 或 sci.stat.math 这样的新闻组。无论如何,如果我试图回答这个问题,我需要对问题进行更清晰的解释。

标签: algorithm math


【解决方案1】:

你的问题不清楚。如果您想通过包含您获得的附加数据来估计新的总百分比,您必须有与您的百分比相关联的数量,以便您可以创建一个有意义的加权平均值。

如果您想确定新数据集的分布是否与历史数据不同,则有几个测试主要针对低于特定值的累积实际值与预期值的百分比进行钝角计算。关于比较两个总体分布的主题有很多文献。

对于配对样本Wilcoxon-Rank 是一种标准方法,前提是您不能对数据的分布做出任何假设。对于非配对数据non-parametric statistics 存在,但它们需要一些深入研究。

【讨论】:

    【解决方案2】:

    第 1 步:如果您的总体百分比为 17% → 30%,那么实际(总)105 → ~189。

    第二步:这个数字需要分布在Actual column

    中的所有元素上

    从这里开始,事情变得非线性,我们需要一些公式来从 POssible 得出实际值。这需要是总数的函数。

    即功能(可能,总计(实际))=实际。

    如果我们能达到上述要求,那么它可能会起作用;)

    【讨论】:

    • 嗯?我想我没有得到一些基本的东西。
    【解决方案3】:

    如果您的新总数为 x,则将 (22/627)*x 尽可能用于第 1 层,将 (21/627)*x 作为第 1 层的实际值,这将为您提供与之前相同的百分比1. 然后对其他层执行相同的操作(因此第 2 层可能是 (45/627)*x 等)。

    【讨论】:

      猜你喜欢
      • 2022-11-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-07-25
      相关资源
      最近更新 更多