正则表达式在第一个数字之前获取所有内容答案

【问题标题】：regex to get everything before first number正则表达式在第一个数字之前获取所有内容
【发布时间】：2018-01-04 02:33:36
【问题描述】：

我不知道如何让这个正则表达式工作。

我的样本数据向量如下所示：

claims40 1.1010101
clinical41 391.1
...

它遵循以下模式：

我正在尝试在数据框中创建一个仅包含名称的新列，该名称可以是可变数量的字符。

所以新列应该是这样的：

claims
clinical
...

当我尝试使用表达式时：

^(.*?)\\d

在正则表达式中，我没有得到正确的字符匹配长度。

问题：什么是正确的正则表达式来捕获字符串中第一个数字之前的所有内容？

【问题讨论】：

标签： r regex

【解决方案1】：

gsub("[^a-zA-Z]", "", c("claims40 1.1010101", "clinical41 391.1"))
# [1] "claims"   "clinical"

也是这个posix风格：

gsub("[^[:alpha:]]", "", c("claims40 1.1010101", "clinical41 391.1"))
# [1] "claims"   "clinical"

【讨论】：

【解决方案2】：

如果你特别想匹配到第一个数字，你也可以这样做

gsub("^(.+?)(?=\\d).*", "\\1", c("claims40 1.1010101", "clinical41 391.1"), perl = TRUE)

[1] "claims"   "clinical"

【讨论】：

【解决方案3】：

还有来自stringr的str_extract：

stringr::str_extract(c("claims40 1.1010101", "clinical41 391.1"), "^[[:alpha:]]+")
# [1] "claims"   "clinical"

这会“提取”字母字符，而不是删除其他所有内容。

【讨论】：