【发布时间】:2013-11-11 01:09:24
【问题描述】:
这看起来应该很简单,但我有一个数据框,需要提取id 与trial 之间每对可能的分数的相关性(换句话说,比较试验 10 上 id 1 的分数到试验 10 上的 id 2,试验 10 上的 id 1 到试验 10 上的 id 3,依此类推。示例数据帧如下。
id <- c('1','1','1','2', '2', '2', '3', '3', '3')
trial <- c('10','11','12','10', '11', '12', '10', '11', '12')
score<- c('634', '981','101', '621', '31', '124', '827', '404', '92')
d <- data.frame(id, trial, score)
d
id trial score
1 10 634
1 11 981
1 12 101
2 10 621
2 11 31
2 12 124
3 10 827
3 11 404
3 12 92
结果应该是一个具有所有可能组合相关性的新矩阵。从表面上看,它是用于评估跨 id 的分数可靠性。
数据大约有 10000 行长,导致 R 阻塞。我查看了这里的论坛并尝试使用comb 或outer 来解决这个问题,但对语法感到困惑。任何帮助将不胜感激!
【问题讨论】:
标签: r iteration reliability