【发布时间】:2015-09-04 08:00:23
【问题描述】:
我有两个用于多媒体数据集的分类器。一种用于视觉材料,一种用于文本材料。我想结合这些分类器的预测来做出最终的预测。我一直在阅读有关 bagging、boosting 和 stacking ensemble 的信息,所有这些看起来都很有用,我想尝试一下。但是,我似乎只能为我的具体问题找到相当理论的例子,没有足够具体的例子让我理解如何实际实现它(在带有 scikit-learn 的 python 中)。我的两个分类器都使用 10 KFold CV 和 SVM 分类。两者都输出带有预测的n_samples = 1000 列表(1 或0)。另外,我让它们都生成了预测所基于的概率列表,如下所示:
[[ 0.96761819 0.03238181]
[ 0.96761819 0.03238181]
....
[ 0.96761819 0.03238181]
[ 0.96761819 0.03238181]]
我将如何将这些组合成一个整体。我应该使用什么作为输入?我试过水平连接标签预测并将它们作为特征输入,但没有运气(概率相同)。
【问题讨论】:
标签: python scikit-learn classification