【发布时间】:2018-01-26 17:50:29
【问题描述】:
我听过很多关于 SVM 和内核技巧的讲座,但我不确定如何找到要使用的内核以及参数是什么。您是否使用梯度方法找到参数?我知道内核的作用,但是您如何选择使用哪个内核以及使用多少个内核?
【问题讨论】:
我听过很多关于 SVM 和内核技巧的讲座,但我不确定如何找到要使用的内核以及参数是什么。您是否使用梯度方法找到参数?我知道内核的作用,但是您如何选择使用哪个内核以及使用多少个内核?
【问题讨论】:
参数一般是选型的问题。因此,为此我建议进行交叉验证。就内核而言,我们希望选择一个在不过度拟合数据的情况下最小化测试错误的内核。例如,高次多项式可能会过度拟合数据。我们可以选择RBF/gaussian kernel。当词汇非常复杂时使用它们。在小样本设置中,由于剪刀效应,您应该使用简单的分类器/内核。您还可以阅读更多内容:
【讨论】: