【问题标题】:How to extract an English word's root and affixes?如何提取英语单词的词根和词缀?
【发布时间】:2014-08-25 07:06:34
【问题描述】:

我是一名中国学生,我正在使用抽认卡软件学习英语单词。我认为突出单词的词根和词缀对于记住该单词非常有用。所以我正在寻找可以提取词根和词缀的算法或查找表。

例如:

foo("agriculture") -> ["agri", "cult", "ure"]
foo("anniversary") -> ["ann", "vers", "ary"]

【问题讨论】:

  • 没那么简单,但您可以使用Stemming agorithms 部分实现。
  • @amit 我之前尝试过:agriculture -> agriculturanniversary -> anniversari。它更像是一种降噪算法,而不是把一个词分成不同的部分。
  • 源自希腊语或拉丁语的词汇化词不是英语形态学的产物,在英语词典中通常仅以它们被借入英语的形式列出。对于您列出的示例单词,您可能应该查看词源词典。 ("Annum" 拉丁文year + versus;"ager" 拉丁文field + "cultura" 拉丁文cultivation;等等)。
  • 要获得更多乐趣和冒险,请查看smörgåsbord 的词源对您是否有意义。

标签: algorithm nlp


【解决方案1】:

您需要进行形态分析。也就是将输入文本拆分成词素。

我发现这个工具你可以在线试用:http://nlpdotnet.com/services/Morphparser.aspx

另外,您可能想查看 ACL wiki (http://aclweb.org/aclwiki/index.php?title=Morphology_software_for_English),这里有很多您可能感兴趣的工具。

祝你好运。

【讨论】:

  • 谢谢!在线解析器在解析默认单词“international”时的结果正是我想要的。但是在解析“农业”和“周年纪念”的时候就不行了。
  • 我找不到提供类似功能的库。你能给我一些进一步的建议吗?
猜你喜欢
  • 2014-11-11
  • 2016-07-18
  • 2011-07-20
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2014-02-10
  • 2012-03-03
  • 2014-04-04
相关资源
最近更新 更多