【发布时间】:2020-09-16 19:04:13
【问题描述】:
我想从数据集中删除重复值。不过我不想删除整行,我想删除该值并将其留空。
以下是我正在使用的数据框示例。
A01 A02 A03 A032 A01_CD A02_CD A03_CD A032_CD
1 4.9 NA NA NA 4.9 NA NA NA
2 4.9 NA NA NA NA NA NA NA
5 4.8 NA NA NA NA NA NA NA
9 4.8 NA NA NA 4.8 NA NA NA
16 4.7 NA NA NA 4.8 NA NA NA
18 4.7 NA NA NA NA NA NA NA
31 5.0 NA NA NA NA NA NA NA
这是我想要达到的结果。
A01 A02 A03 A032 A01_CD A02_CD A03_CD A032_CD
1 4.9 NA NA NA NA NA NA NA
2 4.9 NA NA NA NA NA NA NA
5 4.8 NA NA NA NA NA NA NA
9 4.8 NA NA NA NA NA NA NA
16 4.7 NA NA NA 4.8 NA NA NA
18 4.7 NA NA NA NA NA NA NA
31 5.0 NA NA NA NA NA NA NA
我一直在使用:No_Duplicates = dataset11 %>% distinct(A01, A02, A03, A032, A01_CD, A02_CD, A03_CD, A032_CD, .keep_all = TRUE) 但这会删除整行,我不希望这样。
【问题讨论】:
标签: r duplicates tidyverse