【发布时间】:2015-02-27 09:32:03
【问题描述】:
我很难过滤 pandas 中的 groupby 项目。我想做
select email, count(1) as cnt
from customers
group by email
having count(email) > 1
order by cnt desc
我做到了
customers.groupby('Email')['CustomerID'].size()
它为我提供了正确的电子邮件列表及其各自的计数,但我无法实现having count(email) > 1 部分。
email_cnt[email_cnt.size > 1]
返回1
email_cnt = customers.groupby('Email')
email_dup = email_cnt.filter(lambda x:len(x) > 2)
使用email > 1 提供客户的全部记录,但我想要汇总表。
【问题讨论】:
标签: python sql pandas dataframe