【发布时间】:2016-07-23 06:31:18
【问题描述】:
我知道这个问题一定在某个地方得到了回答,但我就是找不到。
问题:groupby操作后对每组进行采样。
import pandas as pd
df = pd.DataFrame({'a': [1,2,3,4,5,6,7],
'b': [1,1,1,0,0,0,0]})
grouped = df.groupby('b')
# now sample from each group, e.g., I want 30% of each group
【问题讨论】:
-
从 pandas 1.1 开始,您可以使用
df.groupby('b').sample()。 Relevant docs
标签: python pandas random group-by pandas-groupby