【发布时间】:2017-02-16 13:24:02
【问题描述】:
我正在使用银行数据来预测每天的门票数量。我正在使用堆叠来获得更准确的结果并使用brew 库。
这里是重要特征的示例数据集:
[] 这是目标属性示例:
[]
代码如下:
from stacked_generalization.lib.stacking import StackedClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.linear_model import LogisticRegression, RidgeClassifier
# Stage 1 model
bclf = LogisticRegression(random_state=1)
# Stage 0 models
clfs = [RandomForestClassifier(n_estimators=40, criterion = 'gini', random_state=1),
gbm,
RidgeClassifier(random_state=1)]
sl = StackedClassifier(bclf, clfs)
sl.fit(training.select_columns(features).to_dataframe().as_matrix(), np.array(training['class']))
这是训练数据格式:
[[ 21 11 2014 46 4 3]
[ 22 11 2014 46 5 4]
[ 24 11 2014 47 0 4]
...,
[ 30 9 2016 39 4 5]
[ 3 10 2016 40 0 1]
[ 4 10 2016 40 1 1]]
但是,我将我的代码与库中给出的示例进行了比较,但仍然无法弄清楚我哪里出错了。请帮助我。
【问题讨论】:
-
训练对象的格式是什么?
-
更新了我的答案,首先它在 sframe 中,然后我将它转换为 numpy nd 数组
-
错误与数组索引有关。
c.classes_是一个嵌套列表或除整数或布尔值之外的列表。它们是字符串吗?
标签: python numpy machine-learning ensemble-learning