【发布时间】:2011-12-08 02:28:54
【问题描述】:
在浏览器环境(主要是 Javascript)或作为 Web 应用程序中应用机器学习技术,更具体地说是文本挖掘技术,并不是一个被广泛讨论的话题。
我想构建自己的 Web 应用程序/浏览器扩展程序,可以完成一定级别的文本分类/可视化技术。我想知道,是否有任何开源项目在 Web 应用程序中应用文本挖掘技术,甚至更好地作为浏览器扩展?
到目前为止,这些是我通过几天的随机搜索收集到的项目/讨论:
对于网络应用中的文本挖掘:
- http://text-processing.com/ 和 demo(闭源,API 有限)
-
uClassify(关闭源代码,没有关于库库的信息)
对于 Javascript 中的机器学习:
- Discussion 关于机器学习的可能性 JavaScript。 (主要是说 Node.js 将改变格局)
- brain - javascript supervised machine learning
- 使用 Javascript 实现朴素贝叶斯的 demo project
对于web应用文本挖掘,我能想到的架构师:
- Python 库(例如 NLTK 或 scikit-learn)+ Django
- Java 库(很多)+ 玩!框架
- 甚至基于 R + rApache
【问题讨论】:
-
谁给我投反对票?你能解释一下为什么吗?我认为我的问题不符合“没有显示任何研究努力;不清楚或没有用”.....
-
邪恶就在我们中间。为什么@Bahaus 的答案是 -1?
-
@Mustafa 不确定,可能是同一个人......
-
可视化技术怎么样!你发现哪种技术更适合 JS,你是用 MongoDB 来取数据的吗!
-
根据 [我可以在这里询问哪些主题?][stackoverflow.com/help/on-topic].具体来说,第 4 点说“要求我们推荐或查找书籍、工具、软件库、教程或其他场外资源的问题对于 Stack Overflow 来说是题外话……”是题外话。
标签: machine-learning nlp classification weka nltk