【发布时间】:2023-03-16 00:22:01
【问题描述】:
我有一些像这样奇怪的字符串混合的数据集
ID State
1 NA
2 IL
3 IL,IL,IL
4 OH,IL
5 NM,NM,AL,AL
6 FL,FL,FL
我喜欢
- 如果 State 值是两个不同的状态,则用 NA 替换它们并且
- 如果 State 值相同但重复,则将其替换为唯一值。
预期数据集
ID State
1 NA
2 IL
3 IL
4 NA
5 NA
6 FL
我尝试了paste(unique(df$State), collapse=","),但没有奏效。非常感谢您对此提出的任何建议。谢谢。
【问题讨论】:
标签: r string data-cleaning