【问题标题】:Sampling with condition有条件抽样
【发布时间】:2018-12-12 19:28:05
【问题描述】:

我想从点池中抽取固定数量的点,使其满足某些条件。

有什么程序可以做到这一点吗? 如果有关于这个主题的任何论文,那么它也会有所帮助。

示例: 假设我们有 10000 个用户。关于每个用户,我知道有什么收入。现在让我们考虑我想从这个用户池中抽取 150 个用户,这样人口的平均收入就变成了 M。 注:此平均收入(条件)M与总人口均值不同。

提前致谢。

【问题讨论】:

  • 你这样做的目的是什么。如果您希望每次样本都保持不变,那么您可以尝试随机数字段,以便每次都采用相同的样本。
  • 有条件的随机抽样不再是随机抽样。无论如何,您可以只抽取 n-1 个随机样本,然后选择最后一个样本,这样平均值将等于您想要的结果。
  • 我投票结束这个问题,因为它与编程无关。

标签: machine-learning statistics distribution sampling


【解决方案1】:

如果您的程序目标是在每个样本中实现平等的收入分配,您可以使用分层抽样。您制定收入等级,然后从每个收入等级中随机抽取人群样本。

有关更多理论信息,请参阅此处的维基百科页面:https://en.wikipedia.org/wiki/Stratified_sampling

有关实现示例,请参见此处:Stratified random sampling from data frame

【讨论】:

    猜你喜欢
    • 2015-08-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-09-12
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多