【发布时间】:2015-12-22 03:29:17
【问题描述】:
我花了好几个小时才弄明白。
我有一个数据集 salaries 包含以下列-
['yearID' 'teamID' 'lgID' 'playerID' 'salary']
它列出了每个球队每年每个球员的薪水。
我有另一个数据集 teams 包含以下列-
['yearID', 'teamID', 'W']
它列出了每个团队每年的胜利(用 W 表示)。
使用这两个数据集,我想要一个数据集,其中包含每个团队每年的总薪水和胜利。
我做了很多尝试,但都失败了。这是一个:
我将
salaries数据集按“teamID”和“yearID”分组。-
我将其相加得出一个团队在给定年份的总工资。
salariesGrouped = salaries.groupby(['teamID', 'yearID']).sum() -
我尝试将它与
teams数据集合并,但它失败了,因为salariesGrouped只有一列,即“工资”。pd.merge(salariesGrouped, teams, on=['yearID', 'teamID'])
我该怎么办?
样本数据:
工资:
yearID teamID lgID playerID salary
1999 A X ABC 100
1999 A Y XXX 900
2000 B Z YYY 300
2001 A K ZZZ 200
团队:
yearID teamID W
1999 A 20
2000 B 30
2001 A 40
2002 D 10
预期输出:
teamID yearID W salary
A 1999 20 1000
2000 40 200
B 2000 30 300
【问题讨论】: