【发布时间】:2015-02-28 05:09:33
【问题描述】:
我的问题是
我想构建一个一类 SVM 分类器来识别测试文件中的名词/方面。 训练文件有名词列表。测试有单词列表。
这就是我所做的:
我正在使用 Weka GUI,并且我已经训练了一类 SVM(libSVM) 来获取模型。
现在模型对测试文件中分类器在生成的模型中识别为名词的那些词进行分类。其他被归类为异常值。 (所以它只是像查找一样工作。如果它在训练模型中被识别为名词,则为“是”,否则为“否”)
那么如何构建一个合适的分类器呢? (我的意思是输入的格式以及它应该包含什么信息?)
注意:
- 我不在训练文件中给出反例,因为它是一个类。
- 我的输入格式是arff
- 训练文件的格式是一组word,yes
- 测试文件的格式是一组word,?
编辑 我的测试文件将包含名词短语。所以我的分类器的工作是从测试文件中的候选人那里获取名词词。
【问题讨论】:
-
我不确定谈论“一类”分类器是否有意义。我会将您的问题描述为一个两类问题(“名词”和“非名词”)。通常,您需要两个类中的示例才能训练分类器。
-
感谢您的回复。但是这里讲的是一种分类。(stackoverflow.com/questions/10394615/…)
-
哦,你是说异常检测。
-
是的。如果我不清楚,对不起。
-
建议:更新帖子的标题以反映异常值检测与一类:它变得更加清晰。
标签: machine-learning classification weka libsvm arff