【发布时间】:2020-07-09 15:09:25
【问题描述】:
我有一个如下的熊猫数据框:
import pandas as pd
df = pd.DataFrame({'ORDER':["A", "A", "A", "B", "B","B"], 'GROUP': ["A_2018_1B1", "A_2018_1B1", "A_2018_1M1", "B_2018_I000_1C1", "B_2018_I000_1B1", "B_2018_I000_1C1H"], 'VAL':[1,3,8,5,8,10]})
df
ORDER GROUP VAL
0 A A_2018_1B1 1
1 A A_2018_1B1H 3
2 A A_2018_1M1 8
3 B B_2018_I000_1C1 5
4 B B_2018_I000_1B1 8
5 B B_2018_I000_1C1H 10
我想创建一个列“CAL”作为“VAL”的总和,其中 GROUP 名称对于所有行都相同,最后期望 H 字符。因此,例如,将添加第一两行的“VAL”列,因为“GROUP”之间的唯一区别是第二行的最后一行有 H。第 3 行将保持原样,第 4 行和第 6 行将被添加,第 5 行将保持不变。
我的预期输出
ORDER GROUP VAL CAL
0 A A_2018_1B1 1 4
1 A A_2018_1B1H 3 4
2 A A_2018_1M1 8 8
3 B B_2018_I000_1C1 5 15
4 B B_2018_I000_1B1 8 8
5 B B_2018_I000_1C1H 10 15
【问题讨论】:
标签: python-3.x pandas