【发布时间】:2020-05-16 08:54:12
【问题描述】:
假设我有一个这样的数据框:
import pandas as pd
df = pd.DataFrame({'col1':['A','A', 'A', 'B','B'], 'col2':[2, 4, 6, 3, 4]})
我想只保留其值为col2 的行,这些行分别小于col1 的每个值组的值的第x 个分位数。
例如,对于第 60 个百分位数,数据框应如下所示:
col1 col2
0 A 2
1 A 4
2 B 3
如何在pandas 中有效地做到这一点?
【问题讨论】: