【发布时间】:2020-05-30 12:07:53
【问题描述】:
我有一个数据处理问题,我想计算两支球队在不同比赛中的进球数差异。数据如下所示:
matchId teamId eventSec
1 2799331 6718 443.55984
2 2799331 6726 1152.62584
3 2799331 6718 2113.82370
4 2799331 6718 2066.28793
5 2799332 6710 1001.35775
6 2799332 6721 2469.32876
7 2799333 6734 744.35563
所以其中一条线代表球队进球,matchId 代表比赛,teamId 代表比赛中的球队,eventSec 代表进球的时间。我想要完成的是每行显示得分差异的变量,因此此示例数据中的第一行应该有一个目标差异 1,第二行应该有目标差异 0,第三行目标差异应该是 1等。
我想将此应用到具有许多不同匹配和团队 ID 的大型数据集,因此我需要一个非常通用的解决方案来解决这个问题。我尝试了不同的 dplyr 解决方案,但被卡住了一百万次,真的很需要帮助。
非常感谢!
【问题讨论】:
标签: r dataframe dplyr data-processing