【发布时间】:2018-06-22 14:21:35
【问题描述】:
我是数据分析的新手,所以如果这是一个新手问题,请原谅。我正在对相同的数据运行 PLS 回归,其中 X 由序数变量组成,y 是指示事件是否发生的二元变量。我生成了一些交叉验证分数并得到以下结果:
X = threat.iloc[:,2:96]
y = threat.iloc[:,1]
pls1 = PLSRegression(n_components=10)
result = pls1.fit_transform(X, y)
scoresT = cross_val_score(pls1, X, y, cv=5)
print(scoresT)
[ 0. 0. 0. 0.55965802 0. ]
我知道每个数字代表每个“折叠”的分数,但我希望有一系列数字,例如 [0.2, 0.4, 0.6, 0.7, 0.3] 而不是 [0, 0, 0, 0.5, 0] 所以我不确定这对我的数据或模型到底意味着什么。
有人有什么见解吗?
【问题讨论】:
-
您应该提供一个可重现的最小示例,否则几乎无法提供帮助
标签: python scikit-learn cross-validation