【问题标题】:mapping English words to their singular forms将英语单词映射到它们的单数形式
【发布时间】:2012-05-04 02:15:23
【问题描述】:

示例: 将复数名词映射到其单数形式:children --> child, boxes ---> box 将形容词和副词的比较级和最高级映射到它们的基本形式 映射动词 ....

我曾经找到一个开源资源来实现它。我记得,它是一个数据表?/电子表格?/数据库?的映射。有谁知道开源资源或任何替代/更好的解决方案? 我正在用java编写代码。

【问题讨论】:

    标签: nlp


    【解决方案1】:

    这就是所谓的stemmingLucene(特别是snowball contrib)可以做到这一点。

    有多个different stemming algorithms

    【讨论】:

    • 非常感谢!正是我要找的!
    • 其实这个过程叫做词形还原。见答案here
    • @Khairul 有趣。 Wikipedia says 词形还原是词干提取的子集。
    【解决方案2】:

    80 年代有一篇关于 UNIX 拼写检查器的论文解释了词干提取的工作原理。这篇Wikipedia UNIX Spell 文章提供了该论文的链接,并确定了一些替代方案。

    【讨论】:

      猜你喜欢
      • 2011-08-19
      • 2015-01-03
      • 2014-04-04
      • 1970-01-01
      • 1970-01-01
      • 2017-07-06
      • 2019-02-23
      • 2022-01-01
      • 1970-01-01
      相关资源
      最近更新 更多