使用 OpenNLP 进行情绪分析答案

【问题标题】：Sentiment Analysis using OpenNLP使用 OpenNLP 进行情绪分析
【发布时间】：2015-09-23 07:42:41
【问题描述】：

我正在使用 Apache OpenNLP 对 Yammer 对话进行情绪分析。这里的想法是将每个对话分为积极、消极或中性情绪。对话可以是单个句子或一组句子。

我有 2 个模型 - 一个短句分类模型和一个长句分类模型。短句分类模型用较短的句子（少于 10 个词）训练，截断为 2，长句分类模型用较长的句子训练，截断为 5。

这是我的方法

我有几个与此方法相关的问题

【问题讨论】：

【解决方案1】：

我认为你的方法是有效的......尝试在大块文本上构建情感模型是有问题的，所以基于句子的方法对我来说似乎是个好主意。

对于长句和短句模型，这似乎是个好主意，假设短句和长句的内容之间存在足够大的差异（“通常”）。您还可以考虑为较长的句子模型使用不同的特征生成器...有时 ngram（单词双语法）可以很好地帮助将内容上下文化，而不是普通的词袋方法。

至于输出，汇总一个总和可能有点难以标准化，因为每个线程中的句子数量未知（也许......），所以我会考虑做基本统计（最小，最大， sum、avg、stdev、majority），这样您就可以对结果提出更好的问题（例如，您可以将结果写入索引以实现支持多个用例的模糊发现）

HTH

【讨论】：