【发布时间】:2016-09-15 20:20:39
【问题描述】:
希望任何人都可以帮助我解决这个问题。我正在测量分支。我有两个数据集:df.ref(参考)和df.tst(建模)。参考资料指出,有三个分支df.ref$ID,每个分支的宽度和长度值。
df.ref <- data.frame(ID=c(1,2,3))
df.ref$length <- c(1.3,1.8,2.3)
df.ref$width <- c(0.5,0.7,0.9)
df.ref
df.tst 包含相同三个分支的建模测量值。但是,还有更多的分支,六个 df.tst$ID 也有长度和宽度的值。
df.tst <- data.frame(ID=c(1,2,3,4,5,6))
df.tst$length <- c(1.1,1.5,1.8,1.8,2.1,2.6)
df.tst$width <- c(0.6,0.6,0.7,0.9,0.8,1.0)
df.tst
我想使用阈值(例如 0.2)内的长度和宽度值来匹配最接近的模型值和参考值。结果可能是这样的:
results <- data.frame(ID.ref=c(1,2,3))
results$ID.tst.match <- c(1,3,5)
results
我尝试使用 find.matches,但结果不如预期。我也在考虑使用 RMSE 来查看每行的最小 RMSE,并进行迭代,但必须有一个更清洁的解决方案。
此外,可能存在没有解决方案(超出阈值)的情况。 谢谢!!!
【问题讨论】:
-
嗨。我正在查看
df.tst中最接近df.ref中任何行的行。在阈值内,row1 比 row2 最接近(按差异)。