【发布时间】:2018-09-15 23:43:13
【问题描述】:
在重复随机抽样方面需要帮助!给定人口规模,存在 3 个年龄组的 10,000 人:“1-10”岁的 2000 人、“11-20”岁的 3000 人和“21-30”岁的 5000 人。每个年龄组的月薪正态分布如下:年龄'1-10':平均值= 2000,方差= 500^2年龄'11-20':平均值= 3000,方差= 600^2年龄'21- 30':均值 = 4000,方差 = 700^2
注意:样本的年龄组构成必须与人口的年龄组构成相同或接近,即“1-10 岁”组占样本的 20% 或 0.2x50 = 10。目的:执行重复随机从总体中抽样 50 人,并找到样本中位数月薪的抽样分布。说明:用 400 个重复抽样结果来做,并可视化模拟的抽样分布。
这就是我所做的:
import pandas as pd
import matplotlib.pyplot as pet
import numpy as np
import seaborn as sns
sns.set()
population = 10000
repeat = 400
samplesize = 50
samplesize_list = [10, 15, 25]
label_list = ['1-10', '11-20', '21-30']
std_list = [500, 600, 700]
mean_list = [2000, 3000, 4000]
repeat_median = np.empty(repeat, dtype = float)
for j in range(Len(samplesize_list)):
size = samplesize_list[j]
for i in range(repeat):
sample_data = np.random.normal(mean_list[i], std_list[i], size)
repeat.median[I] = np.median(sample_data)
plt.subplot(len(samplesize_list), 1, j+1)
sns.distplot(repeat_median, colour = 'blue', label = label_list[j])
plt.legend(loc = "upper right")
plt.show()
不确定我的代码哪里出错了,但我似乎无法得到我想要的结果
【问题讨论】:
标签: python matplotlib seaborn