【发布时间】:2012-08-23 21:06:55
【问题描述】:
我正在使用 weka SMO 分类器对文档进行分类。smo 有许多可用的参数,例如内核、容差等。我使用不同的参数进行了测试,但在大型数据集上我没有得到很好的结果。
对于超过 90 个类别,只有 20% 的文档得到正确分类。
请任何人告诉我在 SMO 中获得最高性能的最佳参数集。
【问题讨论】:
-
没有通用的最佳参数设置。这完全取决于您的数据和要求。为了让我们给出任何答案,我们需要您使用 which data 准确指定 您想要什么。
-
您尝试过线性支持向量机等更简单的方法吗?你有什么特点?
-
除了 SlimJim 的问题,你的文件是什么,类别是什么?
-
Html 格式文档和咖啡、棉花、大米等 90 多个类别,
标签: java machine-learning classification smo