【发布时间】:2020-06-10 15:46:24
【问题描述】:
我需要计算观察中出现的单词。有些观察只有一个词,但有些观察有多个,并用“/”分隔。
这是一个可重现示例的数据集。
data.1 <-read.csv(text = "
obs, a
2, date
3, Ari
4, MO
5, date/Ari
6, date/MO
7, Ari/MO
8, date/Ari/MO
")
这是我想出的解决方案。但是这个解决方案并没有正确计算那些只有一个词的观察结果。
data.2 <- data.1 %>%
mutate(n.words = lengths(gregexpr("/", a)) + 1)
这是输出
任何帮助将不胜感激。
谢谢。
【问题讨论】: