【发布时间】:2021-08-25 08:52:55
【问题描述】:
我有一个 pandas 数据框,其中有几行几乎是重复的,除了一个值。我的目标是合并这些行并对不同的值求和。
这是一个例子:
names count subject
A 2 physics
A 3 physics
A 3 chemistry
B 2 literature
B 3 literature
B 1 economics
C 3 physics
C 2 chemistry
这就是我想要的:
names count subject
A 5 physics
A 3 chemistry
B 5 literature
B 1 economics
C 3 physics
C 2 chemistry
我尝试使用 groupby(),这就是我得到的:
df2 = df.groupby(["names","subject"]).agg({"count":"sum"})
names subject count
A chemistry 3
physics 5
B economics 1
literature 5
C chemistry 2
physics 3
解决此问题的最佳方法是什么?我研究了 groupby() 函数,但我仍然不太了解。
【问题讨论】:
-
在 groupby 参数中添加
as_index=False