【发布时间】:2021-03-15 10:11:46
【问题描述】:
假设我有以下带有地址的数据,即街道名称。我的目标是将街道名称与门牌号码分开。
mydf <- tribble(
~street,
"Some Way 10",
"Shiny Street 12b",
"Dark Street from Netflix Movie 17c - 17d",
"Seasame Street",
"Dark Alley 15c",
)
mydf <- mydf %>% mutate(street= str_squish(street)) # get rid of whitespace
我尝试了以下
sub <- tidyr::extract(mydf, "street", c("street_name_only", "house_number"), "(\\D+)(\\d.*)") %>%
print(n=5)
只要有街道或门牌号码,它就可以正常工作。如果字符串“street”没有街道号码,则 NA 将显示在新变量“street_name_only”和“house_number”中,就像“芝麻街”一样。 (我想在“new_street_column”中有“Sesame Street”,最好在 house_number 列中有“”(空),尽管之后我可以在 house_number 列中管理 NA。
谁能告诉我哪里出错以及如何解决这个问题?
非常感谢您。
【问题讨论】: