【发布时间】:2015-07-04 20:46:19
【问题描述】:
我正在使用随机森林和 SVM 分类器进行分类,我有 18322 个样本在 9 个类别(3667、1060、1267、2103、2174、1495、884、1462、4210)中不平衡。我使用 10 倍 CV,我的训练数据有 100 个特征维度。在我的样本中,这 100 个维度的训练数据差别不大,当我使用 SVM 时,准确率约为 40%,而当我使用 RF 时,准确率可以达到 92%。然后我让我的数据在这 100 个特征维度上的差异更小,然而,RF 也可以给我 92% 的准确率,但 SVM 的准确率下降到 25%。
我的分类器配置是:
SVM:LinearSVC(penalty="l1",dual=False)
RF: RandomForestClassifier(n_estimators = 50)
所有其他参数都是默认值。我认为我的射频分类器一定有问题,但我不知道如何检查。
任何熟悉这两个分类器的人可以给我一些提示吗?
【问题讨论】:
-
您可能会在CrossValidated得到更好的答案
标签: python classification svm random-forest