【发布时间】:2014-01-27 06:13:24
【问题描述】:
如何从文本文件中提取电话号码?
x <- c(" Mr. Bean bought 2 tickets 2-613-213-4567 or 5555555555 call either one",
"43 Butter Rd, Brossard QC K0A 3P0 – 613 213 4567",
"Please contact Mr. Bean (613)2134567",
"1.575.555.5555 is his #1 number",
"7164347566"
)
这是一个已针对其他语言回答的问题(请参阅 phpabd general regex),但似乎没有在 SO for R 上得到解决。
我已经搜索并找到了似乎可能的正则表达式来查找电话号码(除了上述其他语言的正则表达式):http://regexlib.com/Search.aspx?k=phone 但无法在 R 中使用 gsub 来提取所有示例中的这些数字。
理想情况下,我们会得到类似的东西:
[[1]]
[1] "2-613-213-4567" "5555555555"
[[2]]
[1] "613 213 4567"
[[3]]
[1] "(613)2134567"
[[4]]
[1] "1.575.555.5555"
[[5]]
[1] "7164347566"
【问题讨论】: