【发布时间】:2018-07-12 17:54:51
【问题描述】:
我正在尝试找到一种更快的替代方法来比较数据框 X 中的每个观察结果 i 和观察结果 j。比如运行如下代码
for(i in 1:nrow(X)){
for(j in 1:nrow(X)){
if ( (sum(c(X$Feature1[i], X$Feature1[j])) == 0)&& ((X$Feature2[i] == X$Feature2[j])|(X$Feature3[i] == X$Feature3[j]) ) ){
X$match[i]<-1
}}}
运行 20,000 个左右的观测值需要相当长的时间。 R中是否有任何人都知道的排序/比较算法?提前感谢您的宝贵时间!
【问题讨论】:
-
请提供example data 以使您的问题可重现!
-
outer可能有一个很好的解决方案...