【发布时间】:2011-10-16 11:18:51
【问题描述】:
我正在尝试在 Java 中查找 collocations (PDF)。
我知道NLTK 有一个搭配模块,但不想使用 Jython。
我查看了 OpenNLP 和 GATE,但它们似乎没有搭配查找器。
有人知道实现了免费的开源搭配查找器吗 在 Java 中?
【问题讨论】:
我正在尝试在 Java 中查找 collocations (PDF)。
我知道NLTK 有一个搭配模块,但不想使用 Jython。
我查看了 OpenNLP 和 GATE,但它们似乎没有搭配查找器。
有人知道实现了免费的开源搭配查找器吗 在 Java 中?
【问题讨论】:
对我来说,最好的即用型排序算法是 DragonToolkit 中的xTract,它使用基本的统计数据搭配功能,如 lingpipe 和更复杂的,如 POS 标记
【讨论】:
通过Grant Ingersoll's overview of new features in Mahout,我发现Apache Mahout 现在有一个collocations feature。这是开源的,采用 Java 语言,但需要 Hadoop 基础架构。
【讨论】: