【发布时间】:2014-03-25 06:54:27
【问题描述】:
我有一组trainFeatures 和一组testFeatures,带有正面、中性和负面标签:
trainFeats = negFeats + posFeats + neutralFeats
testFeats = negFeats + posFeats + neutralFeats
例如,trainFeats 中的一项是
(['blue', 'yellow', 'green'], 'POSITIVE')
测试功能列表相同,因此我为每个集合指定标签。我的问题是如何使用随机森林分类器和 SVM 的 scikit 实现来获得该分类器的准确度以及每个类的精度和召回分数?问题是我目前使用单词作为特征,而从我读到的这些分类器需要数字。有没有一种方法可以在不改变功能的情况下实现我的目的?非常感谢!
【问题讨论】:
标签: python machine-learning classification scikit-learn