【发布时间】:2012-08-08 01:43:47
【问题描述】:
我以字符向量的形式提取了一些棒球击球阵容 例如
[1] "Yunel Escobar" "Kelly Johnson" "Jose Bautista" "Adam Lind"
[5] "Edwin Encarnacion" "Brett Lawrie" "Eric Thames" "Colby Rasmus"
[9] "Jeff Mathis"
并在 R 中创建了一个数据框 allLineups,其中列出了 162 场比赛赛季中每场比赛的击球顺序
头(所有阵容)
player order game
Yunel Escobar 1 1
Kelly Johnson 2 1
Jose Bautista 3 1
Adam Lind 4 1
Edwin Encarnacion 5 1
Brett Lawrie 6 1
我现在想做一些分析,包括以下内容
a) 在本赛季中,任何特定的 9 名球员在击球阵容中的频率是多少
b) 完全相同的阵容(包括顺序)出现多少次
c) 两个指定玩家一起出现的频率
d) 对于任何指定的游戏,它的阵容与第一场比赛的阵容相比如何
我会很感激一些关于如何回答这些问题的指导
【问题讨论】:
-
看包plyr.
-
你能不能说得更具体一点。我已经使用了 plyr 来总结一下一个球员在阵容中以特定顺序打了多少次,例如团队和赛季我会使用它,但无法了解如何将其应用于我正在研究的问题
-
@csgillespie。好吧,如果我只有几个字符向量,例如lineup1 和 lineup2 然后 setdiff 函数可能很有用,但我不确定如何在数据帧中得到它
标签: r vector comparison