【发布时间】:2016-03-31 13:11:25
【问题描述】:
我使用的是sklearn Randomized Regression,比如Randomized Logistic Regression。由于随机逻辑回归使用 L1-penalty,因此需要设置正则化参数 C(或 Lasso 中的 alpha)。
为了找到 C 的良好价值,我通常使用简单的 GridSearchCV,如下所示。
但是 RandomizedLogisticRegression() 不支持 GridSearchCV,因为它包含引导。相反,我尝试将典型的 LogisticRegression 与 GridSearchCV 结合使用。
params = {'C':[0.1, 1, 10]}
logi = LogisticRegression(penalty='l1')
clf = GridSearchCV(logi, params, cv=10)
我可以通过这种方式得到 C,但是,当我将此 C 值应用于随机逻辑回归时,没有选择任何属性。可能是 GridSearchCV 选中的 C 比较低。
所以,我想知道在使用随机回归时,是否还有其他好的方法可以确定 C(或 alpha)的公允价值。
之前有一个similar question,但我认为这个答案是针对典型回归的。
谁能给我一个建议?
【问题讨论】:
-
交叉验证呢?
-
不幸的是,使用 LogisticRegressionCV() 产生的结果与 GridSearchCV() 相似。最佳C值太小,每个特征的系数都为0。
标签: python machine-learning scikit-learn regression