【发布时间】:2026-02-10 07:50:02
【问题描述】:
假设正在进行多场足球比赛。当球队失去控球权时会生成一个数据点,并且控球时间会记录在一个文本文件中,如下所示:
'Game','Country','Team','Ball Possession Interval (sec)'
1,Croatia,A,9
2,France,B,11
1,Croatia,A,8
4,Spain,C,10
1,Croatia,B,6
2,France,B,7
3,Germany,C,12
2,France,A,8
...
Game 是球队迄今为止所进行的比赛的计数。例如2,France,B,7 表示来自法国的 B 队,现在正在进行第二场比赛,在持续 7 秒后刚刚失去对球的控球权。
我想要一个按国家/地区分组的图(每个国家/地区的子图),沿轴包含球队,以及每支球队每场比赛的“控球间隔(秒)”总和的箱线图。我尝试了以下,
df.groupby('Country').boxplot(by='Team',column=*vector of sum of ball possession intervals per game*)
但我不知道将 column 设置为什么。我希望我可以将其设置为以下,
df.groupby(['Country','Team','Game'])['Ball Possession Interval (sec)'].sum()
但它不起作用。
有没有简单的方法来做到这一点?
【问题讨论】:
标签: python pandas aggregate pandas-groupby boxplot