【发布时间】:2014-10-21 13:29:31
【问题描述】:
初学者问题。这似乎应该是一个简单的操作,但我无法通过阅读文档来弄清楚。
我有一个具有这种结构的 df:
|integer_id|int_field_1|int_field_2|
integer_id 列是非唯一的,所以我想将 df 按 integer_id 分组并将两个字段相加。
等效的 SQL 是:
SELECT integer_id, SUM(int_field_1), SUM(int_field_2) FROM tbl
GROUP BY integer_id
对最简单的方法有什么建议吗?
编辑:包括输入/输出
Input:
integer_id int_field_1 int_field_2
2656 36 36
2656 36 36
9702 2 2
9702 1 1
使用 df.groupby('integer_id').sum() 输出:
integer_id int_field_1 int_field_2
2656 72 72
9702 3 3
【问题讨论】: