【发布时间】:2016-04-06 00:27:15
【问题描述】:
Python scikit-learn SGDClassifier() 支持 l1、l2 和 elastic,找到正则化参数的最优值似乎很重要。
我得到了使用 SGDClassifier() 和 GridSearchCV() 的建议,但在 SGDClassifier 中只提供正则化参数 alpha。 如果我使用 SVM 或 LogisticRegression 等损失函数,我认为应该有 C 而不是 alpha 来进行参数优化。 使用 Logisitic Regression 或 SVM 时,有什么方法可以在 SGDClassifier() 中设置最优参数?
另外,我还有一个关于迭代参数n_iter的问题,但是没看懂这个参数是什么意思。如果与 shuffle 选项一起使用,它会像 bagging 一样工作吗?那么,如果我使用 l1 惩罚和较大的 n_iter 值,它会像 RandomizedLasso() 一样工作吗?
【问题讨论】:
标签: python machine-learning scikit-learn