【发布时间】:2023-03-24 06:30:02
【问题描述】:
我有这个管道,其中X_train 和y_train 都是具有相同行数的数组(所有整数和浮点数,y_train 是二进制,值为 1 和 0)。当我运行它时,一切似乎都很顺利。这是代码:
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import Pipeline
from sklearn.impute import KNNImputer
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import cross_val_score, KFold
seed = 7
kfold = KFold(n_splits=10)
pipe = Pipeline([
('Scaler', StandardScaler()),
("Imputer", KNNImputer()),
('ML', RandomForestClassifier(max_depth=3))])
results = cross_val_score(pipe, X_train, y_train, cv=kfold, scoring="roc_auc")
当我尝试打印结果时,它给了我这个:
print(results)
array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])
它给出了一个由 10 个值组成的数组。
- 为什么?
- 如何访问这些模型?
- 我该如何选择最好的(假设它们具有不同的值)?
【问题讨论】:
标签: machine-learning scikit-learn classification