【发布时间】:2011-02-16 12:04:36
【问题描述】:
我正在为正在上的大学课程做一个项目。
我正在使用 PHP 构建一个简单的 Web 应用程序,该应用程序根据一组字典将推文分类为“积极”(或快乐)和“消极”(或悲伤)。我现在想到的算法是朴素贝叶斯分类器或决策树。
但是,我找不到任何 PHP 库可以帮助我进行一些严肃的语言处理。 Python 有 NLTK (http://www.nltk.org)。 PHP有类似的东西吗?
我打算使用 WEKA 作为 Web 应用程序的后端(通过在 PHP 中的命令行中调用 Weka),但它似乎效率不高。
你知道我应该为这个项目使用什么吗?还是我应该切换到 Python?
谢谢
【问题讨论】:
-
在您的帖子或您链接的帖子中没有任何迹象表明这是一个合适的解决方案。
-
朴素贝叶斯分类器如果您了解基本原理,自己编写并不是很难。你实际上可以用这种方式在 PHP 中做所有事情。 San Jacinto 已经涵盖了我所说的关于 NLP 部分的所有内容。我可以从几周前做的一个类似项目中告诉你的另一件事是,使用标准词袋方法的情绪分类并不是很有效。不过,我没有尝试像 n-gram 这样的东西......我确实觉得它们会表现得更好,但当然这会给你带来很多额外的维度......
-
在 php/ir phpir.com/bayesian-opinion-mining 上查看有关贝叶斯观点挖掘的文章的链接,这是一个非常值得收藏的网站
-
PEAR 的 Text_LanguageDetect 可以从文本样本中识别 52 种人类语言并返回每种语言的置信度分数。这不是一个值得考虑的有趣选项吗?
-
@nuqqsa 问题是关于情感分析,而不是语言识别,它要求的是 PHP,而不是 Python。
标签: php nlp data-mining nltk weka