【问题标题】:Extract longest word in string提取字符串中最长的单词
【发布时间】:2018-04-18 08:40:16
【问题描述】:

如果可能的话,我想使用tidyverse 包查找并提取字符串中最长的单词。

library(tidyverse)

tbl <- tibble(a=c("ab cde", "bcde f", "cde fg"), b=c("cde", "bcde", "cde"))
tbl
# A tibble: 3 x 1
   a
<chr>
1 ab cde
2 bcde f
3 cde fg

我要找的结果是:

# A tibble: 3 x 2
   a     b
  <chr> <chr>
1 ab cde   cde
2 bcde f  bcde
3 cde fg   cde

与我发现的问题最接近的帖子是:longest word in a string。有没有人想出更简单的方法?

【问题讨论】:

    标签: r string tidyverse


    【解决方案1】:

    这是@PoGibas 答案的一个可能的tidyverse 版本

    library(tidyverse)
    tbl <- tibble(a=c("ab cde", "bcde f", "cde fg"))
    
    tbl %>% 
      mutate(b = map_chr(strsplit(a, " "), ~ .[which.max(nchar(.))]))
    
    #> # A tibble: 3 x 2
    #>        a     b
    #>    <chr> <chr>
    #> 1 ab cde   cde
    #> 2 bcde f  bcde
    #> 3 cde fg   cde
    

    【讨论】:

      【解决方案2】:

      使用基础 R 的解决方案:

      # Using OPs provided data
      tbl$b <- sapply(strsplit(tbl$a, " "), function(x) x[which.max(nchar(x))])
      

      解释:

      • 将每一行拆分为单词 (strsplit)
      • 确定字长 (nchar)
      • 选择行中最长的单词 (which.max)

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2022-01-01
        • 2020-03-04
        • 2020-08-22
        • 1970-01-01
        • 1970-01-01
        • 2018-11-25
        • 1970-01-01
        • 2012-03-21
        相关资源
        最近更新 更多