【发布时间】:2019-01-17 20:33:31
【问题描述】:
尝试在 R 中编写一些 regex 以在 R 中的字符向量中为每个字符串的数字之间提取一些单词。不幸的是,我的 regex 技能几乎无法应对挑战。
这是问题的一个例子和我最初的尝试:
x <- c("1 Singleword 1,234 342", "2 randword & thirdword 1,545 323",
"3 Anotherword wordagain Newword. 3,234 556")
m <- regexpr("[a-zA-Z]+\\s+", x, perl = TRUE)
regmatches(x, m)
这种方法只会产生
"Singleword ", "randword ", "Anotherword "
我需要的是
"Singleword", "randword & thirdword", "Anotherword wordagain Neword."
我相信它需要是某种regex 模式,它以一个字符开头(就像我目前拥有的那样),然后拉出所有内容,直到达到一个数字。
【问题讨论】: