【发布时间】:2018-09-17 03:18:27
【问题描述】:
我之前可能已经问过这个问题,但问题可能不清楚。 我正在尝试通过从 3 个不同的正态分布中抽取 50 个样本大小来进行 300 次重复随机抽样,从而创建样本中位数的样本分布:
subpop1: mean = 100, std dev = 40 (14 of the 50 sample from subpop1)
subpop2: mean = 200, std dev = 70 (20 of the 50 sample from subpop2)
subpop3: mean = 300, std dev = 80 (16 of the 50 sample from subpop3)
那么我该如何解决这个问题呢?这是我到目前为止所做的:
repeat = 300
samplesize_list = [14, 20, 16] ]
std_list = [40, 70, 80]
mean_list = [100, 200, 300]
repeat_median = np.empty(repeat, dtype = float)
for j in range(len(samplesize_list)):
size = samplesize_list[j]
for m in range(len(mean_list)):
mean = mean_list[m]
for z in range(len(std_list)):
std = std_list[m]
for i in range(repeat):
sample_data = np.random.normal(mean, std, size)
repeat_median[i] = np.median(sample_data)
sns.distplot(repeat_median, color = 'blue')
plt.show()
我不确定自己哪里出错了,就像在 Python 入门课程中一样,我需要编码方面的帮助!
【问题讨论】:
标签: python statistics sampling