【问题标题】:Custom words in Package 'qdap' in RR中包'qdap'中的自定义词
【发布时间】:2016-11-28 15:15:40
【问题描述】:

我正在使用 R 中的 qdap 包进行拼写检查。我运行下面的代码并给出这样的输出

which_misspelled("I use a 50Gb broadband connection") 

> 4           5 
>"gb" "broadband"

这些词是有道理的,但对这些词的更正是无关紧要的。是否有任何选项可以让我们为此功能提供自定义词列表以不过滤?

【问题讨论】:

    标签: r text-mining qdap


    【解决方案1】:

    函数which_misspelled() 包含参数dictionary =,默认为qdapDictionaries::GradyAugmented。如果那里没有您输入的单词,则会被视为拼写错误

    例如,如果您希望单词"gb" 被识别为正确的拼写,您应该定义一个新的dictionary

    library(qdap)
    dict <- c(qdapDictionaries::GradyAugmented, "gb")
    which_misspelled("I use a 50Gb broadband connection", dictionary = dict)
    #          5 
    #"broadband" 
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-12-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-07-05
      相关资源
      最近更新 更多