【发布时间】:2011-10-11 09:00:53
【问题描述】:
所以我正在使用 Weka 机器学习库的 JAVA API,并且我有以下代码:
String html = "repeat repeat repeat";
Attribute input = new Attribute("html",(FastVector) null);
FastVector inputVec = new FastVector();
inputVec.addElement(input);
Instances htmlInst = new Instances("html",inputVec,1);
htmlInst.add(new Instance(1));
htmlInst.instance(0).setValue(0, html);
StringToWordVector filter = new StringToWordVector();
filter.setUseStoplist(true);
filter.setInputFormat(htmlInst);
Instances dataFiltered = Filter.useFilter(htmlInst, filter);
Instance last = dataFiltered.lastInstance();
System.out.println(last);
虽然 StringToWordVector 应该计算字符串中出现的单词,而不是让单词“repeat”计数 3 次,但计数结果仅为 1
我做错了什么?
【问题讨论】:
标签: java string api machine-learning weka