【发布时间】:2020-12-20 00:22:33
【问题描述】:
对于下面的输入数据框,我们要创建两列,A_count 和 B_count。
有一个输入变量称为around_row_num。 IE。对于around_row_num=2,我们要查看当前行之前的2行和之后的2行,并计算与当前行具有相同'ID'的'Label'列中'A'的出现次数。
输入:
import pandas as pd
df = pd.DataFrame({'ID': [1, 1, 1, 1, 2, 2],'Label': ['A', 'A', 'B', 'B', 'A', 'B']})
ID Label
0 1 A
1 1 A
2 1 B
3 1 B
4 2 A
5 2 B
around_row_num=2 的输出:
ID Label A_count B_count
1 A 2 1
1 A 2 1
1 B 1 2
1 B 0 2
2 A 1 1
2 B 1 1
谢谢!
【问题讨论】:
-
ID = 1 和 Label = 'B' 的输出不正确,第一个 B 在 2 个空格内有两个 A,第二个 B 有 1 个
标签: python numpy dataframe functional-programming data-science