【发布时间】:2010-12-06 19:30:14
【问题描述】:
我有一个向量 x,我想根据向量 y 中值的顺序对其进行排序。这两个向量的长度不同。
x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
预期的结果是:
[1] 4 4 4 2 2 1 3 3 3
【问题讨论】:
我有一个向量 x,我想根据向量 y 中值的顺序对其进行排序。这两个向量的长度不同。
x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
预期的结果是:
[1] 4 4 4 2 2 1 3 3 3
【问题讨论】:
x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
for(i in y) { z <- c(z, rep(i, sum(x==i))) }
z 中的结果:4 4 4 2 2 1 3 3 3
重要步骤:
for(i in y) -- 循环遍历感兴趣的元素。
z
rep(i, sum(x==i)) -- 重复 i(当前感兴趣的元素) sum(x==i) 次(我们在 x 中找到 i 的次数)。
【讨论】:
您可以将x 转换为有序因子:
x.factor <- factor(x, levels = y, ordered=TRUE)
sort(x)
sort(x.factor)
显然,将数字更改为因子可以从根本上改变下游代码对x 的反应方式。但由于您没有向我们提供任何关于接下来会发生什么的背景信息,我想我会建议将其作为一个选项。
【讨论】:
x 中的值不在排序向量y 中有轻微变化时也可以工作:x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3, 6); y <- c(4, 2, 1, 3); as.numeric(as.character(sort(factor(x, unique(c(y, x))))))
[编辑:显然,Ian 的方法是正确的,但我将把它留给后代。]
你可以通过索引你的 y 向量来做到这一点而无需循环。为 y 添加一个递增的数值并将它们合并:
y <- data.frame(index=1:length(y), x=y)
x <- data.frame(x=x)
x <- merge(x,y)
x <- x[order(x$index),"x"]
x
[1] 4 4 4 2 2 1 3 3 3
【讨论】:
怎么样?
rep(y,table(x)[as.character(y)])
(伊恩的可能更好)
【讨论】:
这个呢
x[order(match(x,y))]
【讨论】:
如果您需要对“y”进行排序,无论是数字还是字符:
x[order(ordered(x, levels = y))]
4 4 4 2 2 1 3 3 3
按步骤:
a <- ordered(x, levels = y) # Create ordered factor from "x" upon order in "y".
[1] 2 2 3 4 1 4 4 3 3
Levels: 4 < 2 < 1 < 3
b <- order(a) # Define "x" order that match to order in "y".
[1] 4 6 7 1 2 5 3 8 9
x[b] # Reorder "x" according to order in "y".
[1] 4 4 4 2 2 1 3 3 3
【讨论】:
您还可以使用sqldf 并通过sql 中的join 函数执行此操作,如下所示:
library(sqldf)
x <- data.frame(x = c(2, 2, 3, 4, 1, 4, 4, 3, 3))
y <- data.frame(y = c(4, 2, 1, 3))
result <- sqldf("SELECT x.x FROM y JOIN x on y.y = x.x")
ordered_x <- result[[1]]
【讨论】: