【发布时间】:2016-08-20 01:43:05
【问题描述】:
我目前正在研究多标签分类。作为分类器,我使用 SVMlight 并将多标签问题二值化。在我的例子中,这意味着超过 1000 次分类运行。
我有一个 1000 的固定特征大小,模型的训练现在需要 3 多天(2 GHz Intel Core 2 Duo,8 GB)。有没有人经历过通常需要这么长时间,或者你能给我任何建议来提高性能吗?您认为改用高性能机器会产生很大的影响吗?
提前致谢!
【问题讨论】:
-
SVM 的确切设置是什么?测试了哪些超参数?训练集有多大?
-
我在分类模式下使用 SVM,其他参数具有线性内核和 SVMlight 标准值。训练集包含 20 000 个文档
标签: performance machine-learning scikit-learn multilabel-classification svmlight