【发布时间】:2018-07-27 19:58:10
【问题描述】:
我已经使用导入这些分类器的 scikit-learn Python 库完成了文本分类:
from sklearn.linear_model import RidgeClassifier
from sklearn.svm import LinearSVC
from sklearn.linear_model import SGDClassifier
from sklearn.linear_model import Perceptron
from sklearn.linear_model import PassiveAggressiveClassifier
from sklearn.naive_bayes import BernoulliNB, MultinomialNB
from sklearn.neighbors import KNeighborsClassifier
from sklearn.neighbors import NearestCentroid
from sklearn.ensemble import RandomForestClassifier
输入文本的格式为:
('some text 1', 'class1')
('some text 2', 'class2')
('some text 3', 'class3')
...
一切都很好。但我想知道的是我是否有多标签文本,例如:
('some text 1', 'class1', 'class3')
('some text 2', 'class2', 'class1')
('some text 3', 'class3')
...
如果可以使用这些分类器,还是应该使用其他分类器?
【问题讨论】:
标签: python scikit-learn classification text-classification