如何计算 R 中观察中的单词答案

【问题标题】：How can I count words in an observation in R如何计算 R 中观察中的单词
【发布时间】：2020-06-10 15:46:24
【问题描述】：

我需要计算观察中出现的单词。有些观察只有一个词，但有些观察有多个，并用“/”分隔。

这是一个可重现示例的数据集。

data.1 <-read.csv(text = "
obs, a
2, date
3, Ari
4, MO
5, date/Ari
6, date/MO
7, Ari/MO
8, date/Ari/MO
")

这是我想出的解决方案。但是这个解决方案并没有正确计算那些只有一个词的观察结果。

data.2 <-  data.1 %>% 
              mutate(n.words = lengths(gregexpr("/", a)) + 1)

这是输出

任何帮助将不胜感激。

谢谢。

【问题讨论】：

标签： r dataframe

【解决方案1】：

这对我有用：

lengths(strsplit(as.character(data.1$a),"/"))

【讨论】：

【解决方案2】：

我们可以使用来自stringr的str_count

library(stringr)
library(dplyr)
data.1 %>% 
    mutate(n.words = str_count(a, "\\w+"))

【讨论】：