【发布时间】:2015-09-17 11:18:36
【问题描述】:
我有一列 (VariableA) 的唯一 ID,我想与多列 (VariableB、VariableC...) 进行比较。
每一列都有唯一的 ID,但一个 ID 可能位于两列或更多列中,如下所示:
VariableA VariableB VariableC
0001 0001 0008
0002 0003 0001
0004 0004 0002
0005 0006
0007 NA
我使用ainb <- variablea[,1] %in% variableb[,1] 检查VariableA 中的值是否存在于VariableB 中,这有效,但我无法搜索找出如何计算VariableA 中存在于多个列中的值(VariableB、VariableC , ETC)。
使用ainall <- variablea[,1] %in% dat[,2:6] 只是给了我所有错误。我相信问题可能是列的长度都不同。我不想按行匹配,只是每个单独的值。
希望这已经足够清楚了!任何帮助表示赞赏。
【问题讨论】:
-
尝试获取其他列的表计数并按第一列进行子集化,例如
table(unlist(df[-1]))[df$VariableA]。数据框的名称是什么?因为这个表达式不应该工作variablea[,1]。其一,它不是您的列的名称,二,列本身没有二维。 -
variablea 是只有一列的 data.frame 的名称(变量 a 的所有 ID)。 dat 是一个 data.frame,其中包含我的所有列。
标签: r