【发布时间】:2019-01-21 09:02:11
【问题描述】:
我正在使用博客,并且拥有包含 account_id 和 session_id 的数据。多个会话可以与一个帐户关联。我想创建一个包含 account_id 的新数据框并计算与该帐户关联的唯一会话数。我的 df 看起来像这样:
account_id session_id
1111 de322
1111 de322
1111 de322
1111 de323
1111 de323
0210 ge012
0210 ge013
0211 ge330
0213 ge333
我正在使用此代码:
new_df = df.groupby(['account_id','session_id']).sum()
我得到的输出如下:
account_id sessions
1111 de322
de323
0210 ge012
ge013
0211 ge330
0213 ge333
我期待的输出
account_id sessions
1111 2
0210 2
0211 1
0213 1
我应该如何解决它?
【问题讨论】:
标签: python pandas pandas-groupby