【问题标题】:How can I count words in an observation in R如何计算 R 中观察中的单词
【发布时间】:2020-06-10 15:46:24
【问题描述】:

我需要计算观察中出现的单词。有些观察只有一个词,但有些观察有多个,并用“/”分隔。

这是一个可重现示例的数据集。

data.1 <-read.csv(text = "
obs, a
2, date
3, Ari
4, MO
5, date/Ari
6, date/MO
7, Ari/MO
8, date/Ari/MO
")

这是我想出的解决方案。但是这个解决方案并没有正确计算那些只有一个词的观察结果。

data.2 <-  data.1 %>% 
              mutate(n.words = lengths(gregexpr("/", a)) + 1)

这是输出

任何帮助将不胜感激。

谢谢。

【问题讨论】:

    标签: r dataframe


    【解决方案1】:

    这对我有用:

    lengths(strsplit(as.character(data.1$a),"/"))
    

    【讨论】:

      【解决方案2】:

      我们可以使用来自stringrstr_count

      library(stringr)
      library(dplyr)
      data.1 %>% 
          mutate(n.words = str_count(a, "\\w+"))
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2021-11-03
        • 2012-03-14
        • 2021-12-11
        • 1970-01-01
        • 2023-01-27
        • 2022-01-11
        • 1970-01-01
        • 2021-05-06
        相关资源
        最近更新 更多