【发布时间】:2018-09-26 11:18:18
【问题描述】:
所以我目前正在熊猫 df 中逐行更新计数器,我认为这不是最快的处理方式。
下面是我正在使用的 df 的简化版本,我有两个计数器 C1 计数每个“S”类别日,C2 计数每次从“N”切换到“S”而不是从“B”到“S”,除非它是从“N”到“B”到“S”。
这是通过 for 循环和 if 语句完成的,但超过 170 万行时速度非常慢。 我进行了相当多的搜索,似乎找不到更“熊猫/numpy”的方法。
任何正确方向的想法或指示将不胜感激。
Date Category C1 C2
1/1/2015 N 0 0
1/2/2015 N 0 0
1/5/2015 S 1 1
1/5/2015 S 2 1
1/6/2015 S 3 1
1/6/2015 S 4 1
1/7/2015 N 4 1
1/7/2015 N 4 1
1/12/2015 N 4 1
1/12/2015 N 4 1
1/13/2015 N 4 1
1/13/2015 S 5 2
1/15/2015 S 6 2
1/15/2015 B 7 2
1/16/2015 S 8 2
1/16/2015 S 9 2
1/16/2015 N 8 2
1/21/2015 N 8 2
1/21/2015 S 9 3
1/22/2015 S 10 3
【问题讨论】:
标签: python pandas loops for-loop