【发布时间】:2017-10-01 02:20:30
【问题描述】:
我正在 Weka 使用 SVM
我有一些数据,我尝试使用 SVM(我尝试了不同的 C 值)技术来分析数据。但是输出完全让我感到困惑,这就是为什么我希望有所帮助。
这是 1 次多项式内核的输出:
Scheme:weka.classifiers.meta.CVParameterSelection -P "C 0.001 10.0 5.0" -X 10 -S 1 -W weka.classifiers.functions.SMO -- -C 0.7 -L 0.001 -P 1.0E-12 -N 0 -V -1 -W 1 -K "weka.classifiers.functions.supportVector.PolyKernel -C 250007 -E 1.0"
Classifier Options: -C 7.5003 -L 0.001 -P 1.0E-12 -N 0 -V -1 -W 1 -K "weka.classifiers.functions.supportVector.PolyKernel -C 250007 -E 1.0"
=== Summary ===
Correctly Classified Instances 83 79.0476 %
Incorrectly Classified Instances 22 20.9524 %
Kappa statistic 0.6555
Mean absolute error 0.0487
Root mean squared error 0.1549
Relative absolute error 91.5633 %
Root relative squared error 100.2828 %
Total Number of Instances 105
这是 2 次多项式内核的输出:
Scheme:weka.classifiers.meta.CVParameterSelection -P "C 0.001 10.0 5.0" -X 10 -S 1 -W weka.classifiers.functions.SMO -- -C 0.7 -L 0.001 -P 1.0E-12 -N 0 -V -1 -W 1 -K "weka.classifiers.functions.supportVector.PolyKernel -C 250007 -E 2.0"
Classifier Options: -C 2.5008 -L 0.001 -P 1.0E-12 -N 0 -V -1 -W 1 -K "weka.classifiers.functions.supportVector.PolyKernel -C 250007 -E 2.0"
=== Summary ===
Correctly Classified Instances 87 82.8571 %
Incorrectly Classified Instances 18 17.1429 %
Kappa statistic 0.7236
Mean absolute error 0.0486
Root mean squared error 0.1547
Relative absolute error 91.4748 %
Root relative squared error 100.1845 %
Total Number of Instances 105
这是高斯核和伽马值 1.0 的输出:
Scheme:weka.classifiers.meta.CVParameterSelection -P "C 0.001 10.0 5.0" -X 10 -S 1 -W weka.classifiers.functions.SMO -- -C 0.7 -L 0.001 -P 1.0E-12 -N 0 -V -1 -W 1 -K "weka.classifiers.functions.supportVector.RBFKernel -C 250007 -G 1.0"
Classifier Options: -C 2.5008 -L 0.001 -P 1.0E-12 -N 0 -V -1 -W 1 -K "weka.classifiers.functions.supportVector.RBFKernel -C 250007 -G 1.0"
=== Summary ===
Correctly Classified Instances 87 82.8571 %
Incorrectly Classified Instances 18 17.1429 %
Kappa statistic 0.721
Mean absolute error 0.0486
Root mean squared error 0.1547
Relative absolute error 91.4571 %
Root relative squared error 100.1651 %
Total Number of Instances 105
这些是我的问题:
为什么“分类器选项:-Cxxxxx”中的分类器具有不同的 C 值?我认为这与我用“C 0.001 10.0 5.0”检查的 C 的值有关,但我可能是错的,我可能会得到错误的结论。我认为使用“C 0.001 10.0 5.0”它会尝试值 0.001、0.01、0.1、1.0 和 10.0。如果这是真的,为什么 C 的值是:7.5003 和 2.5008??
-
正确分类实例的百分比在所有不同的运行中都非常相似,我不明白为什么……这是什么意思?如果是 12%,我会认为 SVM 不是一种合适的技术(它不是线性可分的),但是 80%(更改参数后没有变化或变化很小)我不知道该怎么想……
如果我检查 Weka 的“可视化”中的数据,数据似乎不是线性可分的,但由于在使用 SVM 时转换了更多维度,我认为不可能从可视化中得出结论。
【问题讨论】: