【发布时间】:2012-01-11 09:59:55
【问题描述】:
我正在寻找一种 Java 工具,可以让我做以下事情:
1) 寻找倾斜词的基本形式。示例:
- 对于单词“connection”、“connecting”、“connects”等,它将返回单词“connect”。
- 对于单词“running”、“runs”,它将返回单词“run”。
2) 为每个单词返回其同义词的集合。
有人知道这样的工具吗?
【问题讨论】:
我正在寻找一种 Java 工具,可以让我做以下事情:
1) 寻找倾斜词的基本形式。示例:
2) 为每个单词返回其同义词的集合。
有人知道这样的工具吗?
【问题讨论】:
我假设你只关心英语。
您遇到的第一个问题称为stemming。这个SO post 推荐Porter stemmer 的这个Java 实现。
WordNet 有一个相当大的人工创建/管理的单词数据库及其关系,其中包括同义词等。这是Java API to WordNet。
【讨论】: