【发布时间】:2016-02-08 21:22:44
【问题描述】:
我有一个包含模型特征的大型稀疏矩阵(95000、12000)。我想在 python 中使用 Sklearn.cross_validation 模块进行分层 K 折交叉验证。但是,我还没有找到一种在 python 中索引稀疏矩阵的方法。
无论如何我可以在我的稀疏特征矩阵上执行 StratifiedKFold 吗?
【问题讨论】:
-
很明显,您甚至没有尝试过。 Scikit-learn CV 在稀疏矩阵上工作得很好,因为 csr_matrices 是 scikit-learn 中的默认数据表示。
-
它是否给您一个错误“无法索引整数”?
标签: python machine-learning scikit-learn sparse-matrix cross-validation