【发布时间】:2016-03-18 18:43:25
【问题描述】:
我在 R 中有一个 data.frame,它是多个赛季每支球队的棒球比赛结果的目录。其中一些列是team、opponent_team、date、result、team_runs、opponent_runs 等。我的问题是因为 data.frame 是每个团队的日志组合,每一行本质上在 data.frame 的其他地方都有另一行,它是该行的镜像。
例如
team opponent_team date result team_runs opponent_runs
BAL BOS 2010-04-05 W 5 4
在其他地方有另一行
team opponent_team date result team_runs opponent_runs
BOS BAL 2010-04-05 L 4 5
我想在dplyr 或类似代码中编写一些代码,以选择具有team、opponent_team 和@ 的唯一组合 的行987654332@ 列。我在这里强调单词组合,因为顺序无关紧要,我只是想摆脱镜像的行。
谢谢
【问题讨论】:
-
您在寻找
unique(df)吗? -
如果我们有来自每个团队的日志,并且每一行都有一个镜像,我们不能只取
result == W的数据帧的一个子集吗?这将为每个游戏保留 1 行。 -
我认为这就是您所要求的:
unique(df[,c("team","opponent_team","date")])。问题不完全清楚 -
@paulstey,出色的答案,如此简单明了,我什至从未想过这一点。谢谢!