【发布时间】:2019-07-29 06:05:11
【问题描述】:
我有df,我想从中抽取一些关于某些变量分布的样本。假设df['type'].value_counts(normalize=True) 返回:
0.3 A
0.5 B
0.2 C
我想做类似sampledf = df.sample(weights=df['type'].value_counts()) 这样sampledf ['type'].value_counts(normalize=True) 将返回几乎相同的分布。如何在这里通过频率传递字典?
【问题讨论】: