【问题标题】:Extract only words containing ASCII characters from vector of strings从字符串向量中仅提取包含 ASCII 字符的单词
【发布时间】:2016-12-22 06:08:06
【问题描述】:

我被它困住了,所以,请,欢迎任何建议。

b <- str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE))

返回一个列表:

    List of 2
 $ : chr [1:2] "hello" "ring"
 $ : chr "trust"

但我想为向量c('hello ringпрг','trust') 的每个元素创建一个包含此单词字符串的向量,例如"hello ring", "trust"。也欢迎任何其他功能和软件包。

【问题讨论】:

  • 没有字典是无法只提取英文单词的。现在,如果你真的想提取 ASCII 字符 ...
  • @Roland 你是对的,标题已编辑

标签: r stringr qdap


【解决方案1】:

sapplypaste 一起使用,如下所示:

b<-str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE))

sapply(b, paste, collapse = " ")

## [1] "hello ring" "trust" 

【讨论】:

    【解决方案2】:

    我们可以使用

    unlist(str_extract_all(c('hello ringпрг','trust'), regex("[A-Za-z ]+", TRUE)))
    #[1] "hello ring" "trust" 
    

    或者使用"[[:ascii:]]+"的模式

    【讨论】:

      猜你喜欢
      • 2023-03-24
      • 1970-01-01
      • 2016-04-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-09-12
      • 2015-04-22
      • 1970-01-01
      相关资源
      最近更新 更多