【发布时间】:2017-10-04 09:35:59
【问题描述】:
我有数据框 df,我想保留该数据框列中出现的名称的运行总数。我正在尝试计算运行总列:
name running total
a 1
a 2
b 1
a 3
c 1
b 2
我认为有两种方法可以做到这一点:
遍历数据框并使用包含名称和当前计数的单独字典。每次执行循环时,相关名称的当前计数都会增加 1,并且该值将被复制到我的数据框中。
更改数据框中每个值的字段计数。在 excel 中,我将使用 countif 结合下拉公式 A$1:A1 来修复第一个值,但使第二个值相对,以便我正在查看的范围随行而变化。
问题是我不确定如何实现这些。有没有人对哪个更好以及如何实施有任何想法?
【问题讨论】:
-
如果您使用的是 pandas,请查看
cumcount函数
标签: python loops pandas count cumulative-sum