【发布时间】:2015-04-30 10:08:06
【问题描述】:
嘿,我是这项工作的新手,在搜索了如何通过它之后我感到很困惑! 实际上我想为 weka 创建一个稀疏的 ARFF 文件用于文本分类!我一直在网上搜索如何开始使用它。我的要求是生成一个应该与 weka 兼容的稀疏 arff 文件! arff 的大纲应该是这样的:
@relation myrelation
@attribute att0 numeric
@attribute att1 numeric
@data
{0,1,4,5 , A}
{0,5,2,,1 B}
这样我有一些字符串,然后是一个类 假设我的数据集如下:
string is a string A
Hello a string B
Another is string C
.
.
.
首先是字符串,然后是 A、B 或 C 类... 所以我想要的是将我的数据集转换为上面提到的稀疏 arff 格式。 有人可以给我一个方向,我该怎么做?请 我想用java来做
【问题讨论】:
标签: java weka text-classification arff