【问题标题】:Part-of-Speech Tagging with Lucene使用 Lucene 进行词性标注
【发布时间】:2012-02-06 09:29:51
【问题描述】:

我正在为聊天应用程序构建情绪识别系统。核心部分是在用户输入的文本中找到动词,这可以通过词性标注器来完成。 是否可以使用 Lucene 构建词性标注器?如果没有,我可以使用什么好的开源/libre 软件包或系统?

【问题讨论】:

  • 查找动词称为词性 (POS) 标记,而不是语义角色标记 (SRL)。 SRL 是关于检测语义谓词(不必是动词)的参数类型。我不清楚您究竟希望 POS 标记器或 SRL 系统做什么来使其对情绪识别有用。最后,您的意思是“with Lucene 构建这样的系统”?使用Lucene来构建它?将结果输入 Lucene?
  • 根据您的评论编辑,@jogojapan。

标签: lucene text-mining sentiment-analysis


【解决方案1】:

在 Lucene 中,您可能想要使用 Mahout。我使用了来自 Lucene 的 Mahout 的 Bayes 分类器进行情感分析,它工作得相当好并且相对容易设置。我认为 Mahout+Lucene 与其他任何东西相比的主要优势在于它可以更好地扩展。

如果您不喜欢 Mahout,可以使用大量开源框架来实现这一点。例如,我发现 NLTK 对用户非常友好,尽管我不认为它与 Lucene 集成得很好。

【讨论】:

    猜你喜欢
    • 2016-08-24
    • 1970-01-01
    • 1970-01-01
    • 2019-02-20
    • 1970-01-01
    • 1970-01-01
    • 2012-05-25
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多