【发布时间】:2023-03-31 14:20:01
【问题描述】:
我有以下问题:
我正在研究一个公式来计算一些网络效应。这个想法是我有 450 个“红色用户”和 6550 个“蓝色用户”,总共有 7000 个用户。现在我想绘制“选择 x 个用户(同一用户不能被选择两次,所以这是无替换抽样)并计算至少 1 个用户是红色的概率”。
例如,对于 x = 3,这意味着我从 7000 个随机用户中挑选 3 个并检查其中是否有任何“红色用户”
至少有 1 个红色用户的概率是 p = 1 - 所有 3 个选择都是蓝色用户的概率,蓝色用户的概率等于 p = 6550/7000,对吧?
导致至少 1 个红色用户的概率: * p = 1 - 6550/7000 * 6549/6999 * 6548/6998 *
因此我想出了公式:
f(x) = e^-(1- sum of (6500-i)/(7000-i)); for i = 0, till x)
我意识到曲线非常前卫,因为它只是从 ℕ 中的一个值到 ℕ 中的下一个值。 尽管添加十进制数字没有多大意义,因为“选择 0,5 个用户甚至 0,01 个用户”只是愚蠢的,但我希望看到完整的图表以便能够将公式与其他公式进行比较。
有什么方法可以在 python 中实现吗?
最好的问候,
科尔比
【问题讨论】:
标签: python numpy matplotlib probability-theory