【发布时间】:2021-08-30 15:44:55
【问题描述】:
这是我第一次尝试在 R 中使用 gsub 和正则表达式提取字符串。我想在文本列的每个单元格中第一次出现单词“at”或“around”之后提取三个单词( col)并将提取内容放入新列(new_extract)。
到目前为止,我有以下内容:
df$new_extract <- gsub(".*at(\\w{1,}){3}).*", "\\1", df$col, perl = TRUE)
欢迎任何有关更改/不同方法的建议!
【问题讨论】:
-
我在下面的回答有帮助吗?