【发布时间】:2015-03-06 17:56:51
【问题描述】:
你好!我只需要在 Java 中实现朴素贝叶斯文本分类算法的帮助来测试我的数据集以用于研究目的。必须用Java实现算法;而不是使用 Weka 或 Rapid Miner 工具来获得结果!
我的数据集有以下类型的数据:
Doc Words Category
意味着我预先知道每个训练(字符串)的训练词和类别。部分数据集如下:
Doc Words Category
Training
1 Integration Communities Process Oriented Structures...(more string) A
2 Integration Communities Process Oriented Structures...(more string) A
3 Theory Upper Bound Routing Estimate global routing...(more string) B
4 Hardware Design Functional Programming Perfect Match...(more string) C
.
.
.
Test
5 Methodology Toolkit Integrate Technological Organisational
6 This test contain string naive bayes test text text test
所以数据集来自 MySQL 数据库,它可能包含多个训练字符串和测试字符串!问题是我只需要在 Java 中实现朴素贝叶斯文本分类算法。
算法应该遵循下面提到的例子hereTable 13.1
来源:Read here
问题是我可以自己在 Java 代码中实现该算法,但我只需要知道是否有可能存在某种带有源代码文档的 Java 库,以便我测试结果。
问题是我只需要一次结果只意味着它只是对结果的测试。
那么,说到重点,有人可以告诉我任何好的 Java 库,它可以帮助我在 Java 中编写这个算法,并且可以使我的数据集能够处理结果,或者有人可以给我任何好的想法如何轻松地做到这一点...可以帮助我的好东西。
我会感谢你的帮助。 在此先感谢
【问题讨论】:
-
你在哪里工作?
-
要求我们推荐或查找书籍、工具、软件库、教程或其他非现场资源的问题不属于 Stack Overflow 的主题。
标签: java mysql algorithm text dataset