【问题标题】:Performance SVMlight Multilabel Classificaiton (Features: 1000)性能 SVMlight 多标签分类(特征:1000)
【发布时间】:2016-08-20 01:43:05
【问题描述】:

我目前正在研究多标签分类。作为分类器,我使用 SVMlight 并将多标签问题二值化。在我的例子中,这意味着超过 1000 次分类运行。

我有一个 1000 的固定特征大小,模型的训练现在需要 3 多天(2 GHz Intel Core 2 Duo,8 GB)。有没有人经历过通常需要这么长时间,或者你能给我任何建议来提高性能吗?您认为改用高性能机器会产生很大的影响吗?

提前致谢!

【问题讨论】:

  • SVM 的确切设置是什么?测试了哪些超参数?训练集有多大?
  • 我在分类模式下使用 SVM,其他参数具有线性内核和 SVMlight 标准值。训练集包含 20 000 个文档

标签: performance machine-learning scikit-learn multilabel-classification svmlight


【解决方案1】:

功能归一化解决了我的问题,在要素空间中的最小/最大([-1,1])归一化后的性能要快得多。

【讨论】:

    猜你喜欢
    • 2021-07-18
    • 2013-04-30
    • 2013-09-26
    • 2011-07-26
    • 2020-03-15
    • 2013-12-20
    • 2019-06-14
    • 2019-06-13
    • 2018-05-26
    相关资源
    最近更新 更多