【发布时间】:2014-12-26 18:00:37
【问题描述】:
我已经成功地将 LibSVM API 集成到 mu java 代码中。我需要将大型文档集合转换为数值表示并将其提供给 LibSVM 分类器。据我所知,weka 能够将文档传输到特征向量。谁能告诉我该怎么做?
【问题讨论】:
标签: java classification weka libsvm document-classification
我已经成功地将 LibSVM API 集成到 mu java 代码中。我需要将大型文档集合转换为数值表示并将其提供给 LibSVM 分类器。据我所知,weka 能够将文档传输到特征向量。谁能告诉我该怎么做?
【问题讨论】:
标签: java classification weka libsvm document-classification
你可以这样做
DataSource source = new DataSource(new File("mycsvinputfile"));
System.out.println(source.getStructure());
Instances data = source.getDataSet();
// setting class attribute if the data format does not provide this information
// For example, the XRFF format saves the class attribute information as well
if (data.classIndex() == -1)
data.setClassIndex(data.numAttributes() - 1);
//initialize svm classifier
LibSVM svm = new LibSVM();
svm.buildClassifier(data);
不要忘记在您的项目中使用 weka.jar、libsvm.jar 和 wlsvm.jar(libsvm 包装器)。因此,只需在构建路径或类路径或其他任何内容中包含所有 3 个 jar。
【讨论】: