【发布时间】:2021-02-02 13:31:32
【问题描述】:
我正在尝试使用 mutate 函数将因子级别重新编码为数字,但我想忽略因子出现的字母顺序。因子级别有多个相同的值,我希望为它们分配新列中的数字它们首次出现在数据框中的行。 示例:
library(stringi)
set.seed(234)
data<-stri_rand_strings(20,1)
data<-as.data.frame(data)
data2<-data %>% mutate(num=(as.numeric(factor(data))))
data2
预期结果:
dat<-data2[,-2]
order<-c(1,2,3,2,4,5)
expected_result<-cbind.data.frame(head(dat), order)
expected_result
【问题讨论】: