【发布时间】:2017-10-17 07:21:45
【问题描述】:
我有一个 pandas 数据框,例如:
a b id
1 10 6 1
2 6 -3 1
3 -3 12 1 # id is 1, but needs a tie breaker
4 -2 12 1 # id is 1, but needs a tie breaker
5 4 8 2
6 12 11 2
7 3 -5 2
8 3 -5 2
如何创建一个新的数据框,它首先采用 id 列,然后在每次 b 列超过 10 时获取,如果有多行满足此条件,则通过选择a 列中最小值的行:
a b id
1 -3 12 1
2 12 11 2
我有一个包含大约 2,000,000 行和大约 10,000 个 id 值的数据框,因此 for 循环非常慢。
【问题讨论】:
标签: python pandas numpy group-by