【发布时间】:2013-05-17 07:11:00
【问题描述】:
我正在启动一个以情绪分析为中心的项目。具体来说,我们将对 Twitter、Facebook、YouTube 和其他社交网络数据进行情绪分析。
我从 Apache 知道 OpenNLP。它看起来很棒,但我认为除了它对 Hadoop 等的依赖之外,它对于我想做的事情来说有点重量级。我以前没有使用过它,我对它的评估可能是错误的。
我在本网站的其他地方看到了有关斯坦福 NLP 的信息。我似乎无法从这个库中找到一个好的起点;一个教程之类的。
另外,我在本网站上阅读了有关情绪分析 API(如 AlchemyAPI)的信息,但我想要一个完全由我控制的解决方案。我只想要一个可以与我的应用程序捆绑在一起的库。
简而言之,我正在寻找一种轻量级的解决方案,并且可以在我的本地 PC 中进行设置。此外,非常感谢您指出斯坦福 NLP 或 OpenNLP 的良好起点。
更新:
我已经阅读了 UIMA 文档及其对 OpenNLP 组件和其他第三方组件等组件的支持,此外,它内置的文本处理功能使其成为一个有吸引力的起点。它的开放式架构让我觉得它非常适合我想要实现的目标。额外的建议或建议仍将不胜感激。
【问题讨论】:
-
OpenNLP 不依赖于 Hadoop。我认为它比 UIMA 更轻量级(尽管您无法真正比较它们)。
-
我正在考虑从 UIMA 开始,然后在需要时插入 OpenNLP。我还看到 UIMA 支持其他几个用于文本处理的组件。因此,我想从 UIMA 开始将使 mr 在需要时利用这些组件。