【发布时间】:2016-02-05 14:15:03
【问题描述】:
我在 R 中有两个数据框,一个很大但不完整(导入),我想创建一个更小、更完整的子集(导出)。 $unique_name 列中的每个 ID 都是唯一的,不会出现两次。其他列可能是例如体重,但也可能是与唯一 ID 对应的其他类别。我已经编写了这段代码,一个双循环和一个 if 语句,它确实有效,但速度很慢:
for (j in 1:length(export$unique_name)){
for (i in 1:length(import$unique_name)){
if (toString(export$unique_name[j]) == toString(import$unique_name[i])){
export$body_mass[j] <- import$body_mass[i]
}
}
}
我对 R 不是很好,但我知道这是一种不好的方法。关于如何使用 apply() 或 plyr 包之类的函数来实现它的任何提示?
比约恩
【问题讨论】:
-
见
merge。这是一个连接操作。 -
我可能会误解,但这不只是 export
-
感谢 A.Webb,正是我所需要的。