【发布时间】:2019-02-04 14:43:15
【问题描述】:
这个问题是我问here的这个问题的延续:
现在我有这样的数据:
Sno User Cookie
1 1 A
2 1 A
3 1 A
4 1 B
5 1 C
6 1 D
7 1 A
8 1 B
9 1 D
10 1 E
11 1 D
12 1 A
13 2 F
14 2 G
15 2 F
16 2 G
17 2 H
18 2 H
假设我们有 5 个用于用户 1“A、B、C、D、E”的 cookie。现在我想计算在遇到新 cookie 后是否再次出现任何 cookie。例如,在上面的示例中,cookie A 再次出现在第 7 位,然后也在第 12 位。注意我们不会同时计算 A 在第 2 位,但在第 7 位和第 12 位我们在再次看到 A 之前已经看到了许多新的 cookie,因此我们计算了那个实例。如果我运行previous post 中提到的代码,这就是我将得到的结果:
对于用户 1
Sno Cookie Count
1 A 2
2 B 1
3 C 0
4 D 2
5 E 0
对于用户 2
Sno Cookie Count
6 F 1
7 G 1
8 H 0
现在是棘手的部分,现在我们通过计数知道,对于用户 1,三个 cookie“A、B 和 D”再次出现。类似地,对于用户 2,“F 和 G”再次出现。我想像这样聚合这些结果:
Sno User Reoccurred_Instances
1 1 3
2 2 2
有没有更简单的方法而不使用循环来获得这个结果。
【问题讨论】:
标签: python pandas loops count logic