【发布时间】:2020-01-04 00:50:36
【问题描述】:
我正在使用 scikit 和 svm 将数据分为 7 个类。数据是音频,我将它们切成 30 毫秒的帧。 最后,大约有 100 万帧,每个帧都用作具有 13 个 mfcc 特征的标记样本。 当按照以下代码拟合数据时,我的 cpu 使用率保持在 20% 左右,但没有任何反应!我已经等了大约 30 个小时,但还没有完成。 是不是样本数太多了?!!
clf = SVC(C=20.0, gamma=0.00001)
clf.fit(X_train, y_train) #This is where it gets stuck
【问题讨论】:
-
你可以设置
verbose=True让它定期报告模型训练,你可以设置max_iter来限制模型在拟合过程中的迭代次数。你gamma的值也让我觉得非常小,默认是 1/n_features,所以在你的情况下,1/13=0.07。你也可以试试其他的内核和c值,不过verbose是个不错的入手方式
标签: python scikit-learn svm multiclass-classification