【问题标题】:Algorithm for detecting misspelled entities检测拼写错误实体的算法
【发布时间】:2019-04-16 14:08:18
【问题描述】:

我有一个用户在文本输入框字段中拼写错误的城市名称列表,例如(Chiqago、Neww jork 或 Niu yorc 等)。我想知道R是否可以解决这种接收写得不好的城市并转换为正确城市名称的问题。

Input city : Chiqago, Neww jork, Niu yorc, St Fransis
Output city: Chicago, New York, New York, San Francisco

【问题讨论】:

  • 一种快速方法,即在已知正确的“字典”上最小化马氏(或类似)距离,可能会解决简单案例

标签: r


【解决方案1】:

我建议查看stringr 包。您可以使用str_detect 查找不正确的模式,并使用str_replacestr_replace_all 将其替换为正确的模式。

https://cran.r-project.org/web/packages/stringr/vignettes/stringr.html

【讨论】:

    猜你喜欢
    • 2011-10-30
    • 2010-10-16
    • 1970-01-01
    • 1970-01-01
    • 2012-03-04
    • 2015-09-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多