【问题标题】:Count unique string in a character column计算字符列中的唯一字符串
【发布时间】:2017-10-12 13:56:05
【问题描述】:

我有一列包含字符串观察值,我需要计算该列中的唯一单词。例如

我希望我的最终输出看起来像这样-

列中的单词使用空格分开,所以这对我来说是另一个挑战。

谢谢

【问题讨论】:

  • 你应该看看strsplittable

标签: r text count strsplit


【解决方案1】:

这里有一个解决方案。

# the data
dat <- data.frame(X = c("Program Manager", "Program Coordinator",
                        "Senior Manager", "Senior Associate",
                        "Senior Researcher"),
                  stringsAsFactors = FALSE)

# count words  
table(unlist(strsplit(dat$X, " +")))

结果:

  Associate Coordinator     Manager     Program  Researcher      Senior 
          1           1           2           2           1           3 

使用as.data.frame 可以将结果转换为数据框。

tab <- table(unlist(strsplit(dat$X, " +")))
as.data.frame(tab)

结果:

         Var1 Freq
1   Associate    1
2 Coordinator    1
3     Manager    2
4     Program    2
5  Researcher    1
6      Senior    3

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-12-25
    • 1970-01-01
    • 2014-07-08
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多