【发布时间】:2021-12-30 19:04:40
【问题描述】:
我需要对两种略有不同的列表进行排序;但是,我只需要对列表的某些部分进行排序,同时保留一些元素(即它们的索引应该保持不变)。
首先,假设我有一个数字列表:
x <- c(4, 8, 1, 7, 3, 0, 5, 2, 6, 9)
我知道如果我只想对前 5 个元素进行排序,那么我可以这样做:
x[1:5] <- sort(x[1:5])
x
# [1] 1 3 4 7 8 0 5 2 6 9
其次,如果我想对列表进行排序,但保留 NA,那么我可以这样做(尽管我确信有更好的方法来做到这一点):
y <- c(4, 8, 1, NA, NA, 7, 3, 0, 5, 2, NA, 6, NA, 9)
y[which(is.na(y)==FALSE)] <- sort(y[which(is.na(y)==FALSE)])
y
# [1] 0 1 2 NA NA 3 4 5 6 7 NA 8 NA 9
问题:如何按组对包含字母数字字符的列表进行排序?所以,我想先按预定义的字母顺序(即c(C, A, B))对列表进行排序,然后按组按数字排序,但将 NA 保留在其原始索引位置?
z <- c('B' , 'B1', 'B11', 'B2', 'A', 'C50', 'B21', NA, 'A5',
'B22', 'C', NA, 'C1', 'C11', NA, NA, 'C2', NA)
预期输出
c('C', 'C1', 'C2', 'C11', 'C50', 'A', 'A5', NA, 'B', 'B1', 'B2', NA, 'B11', 'B21', NA, NA, 'B22', NA)
# [1] "C" "C1" "C2" "C11" "C50" "A" "A5" NA "B" "B1" "B2" NA "B11" "B21" NA NA "B22" NA
我知道,如果我只想按字母顺序排序,那么我可以使用与上面相同的代码。但是,这些也不能按数字正确排序。
z[which(is.na(z)==FALSE)] <- sort(z[which(is.na(z)==FALSE)])
z
# [1] "A" "A5" "B" "B1" "B11" "B2" "B21" NA "B22" "C" "C1" NA "C11" "C2" NA NA "C50" NA
但是,我不确定如何将字母的顺序更改为c(C, A, B),因为它们是字母数字的并且可以正确地按数字排序。我知道我可以使用order 和match:
f <- sort(z[which(is.na(z)==FALSE)])
z[which(is.na(z)==FALSE)] <- f[order(match(f, c("C","A","B")))]
# [1] "C" "A" "B" "A5" "B1" "B11" "B2" NA "B21" "B22" "C1" NA "C11" "C2" NA NA "C50" NA
但这只有在完美匹配的情况下才会改变(因此只有 C、A 和 B 移动到列表的开头,然后组丢失),并且必须给出完整的匹配是不谨慎的match 的字母数字列表。我确信有一种简单的方法可以做到这一点(例如,grepl),但我不确定如何实现它。
【问题讨论】: