【问题标题】:GSub removing all characters before first digit [duplicate]GSub删除第一个数字之前的所有字符[重复]
【发布时间】:2020-09-11 20:13:36
【问题描述】:

我正在使用 R 来清理一些非常脏的地址。我想使用 gsub 删除字符串中第一个数字之前的所有字符,但似乎可以找出一个有效的正则表达式。有什么建议吗?

以下是三个数据示例:

C/O Bob Jones1071 Main St

请验证中心路 64 号的地址

Joe's Bakery33 Pleasant Ave #4

【问题讨论】:

  • 您找不到涵盖所有内容的地址,因为地址不符合格式。你可以试试^\D+

标签: r regex gsub


【解决方案1】:

你可以试试这个方法

library(dplyr)
library(stringr)
df %>% 
  mutate(V2 = str_extract_all(V1, "\\d+.*"))
#                             V1                 V2
# 1           C/O Bob Jones1071 Main St       1071 Main St
# 2 PLEASE ADDRESS VERIFY64 Center Road     64 Center Road
# 3       Joes Bakery33 Pleasant Ave #4 33 Pleasant Ave #4

数据

structure(list(V1 = c("C/O Bob Jones1071 Main St", "PLEASE ADDRESS VERIFY64 Center Road", 
"Joes Bakery33 Pleasant Ave #4")), class = "data.frame", row.names = c(NA, 
-3L))

【讨论】:

    猜你喜欢
    • 2019-06-16
    • 2015-12-22
    • 2021-11-29
    • 1970-01-01
    • 1970-01-01
    • 2016-04-26
    • 1970-01-01
    • 2015-12-03
    • 1970-01-01
    相关资源
    最近更新 更多