【发布时间】:2015-12-19 11:56:38
【问题描述】:
我想使用 python scikit-learn 执行 bagging。 我想结合 RFE(),递归特征选择算法。 步骤如下。
- 制作 30 个允许冗余选择(装袋)的子集
- 对每个数据集执行 RFE
- 获取每个分类的输出
- 从每个输出中找出前 5 个特征
我尝试使用像下面这样的 BaggingClassifier 方法,但它花费了很多时间并且似乎不起作用。仅使用 RFE 没有问题(rfe.fit())。
cf1 = LinearSVC()
rfe = RFE(estimator=cf1)
bagging = BaggingClassifier(rfe, n_estimators=30)
bagging.fit(trainx, trainy)
另外,第 4 步可能很难找到最上面的特征,因为 Bagging 分类器在 RFE() 中没有提供像ranking_ 这样的属性。 有没有其他好的方法来实现这 4 个步骤?
【问题讨论】:
-
也是这个问题的答案。好问题
标签: python scikit-learn