【发布时间】:2019-02-17 12:00:48
【问题描述】:
我想知道 sklearn.model_selection learning_curve 是否可以使用或确实使用 sklearn.preprocessing StandardScaler。我已经查看了实现,但我的技能水平达不到标准,无法自行得出结论。所有关于使用 learning_curve 的教程都将整个数据集传递给 learning_curve,learning_curve 会将数据分成训练集和测试集。
任何估算器的所有教程都让您将数据拆分为训练和测试,然后仅缩放训练数据并使用训练数据规模转换测试数据。哪个完全明白。
我是否应该在将整个数据集传递给 learn_curve 之前对其进行缩放。我知道 learning_curve 将使用 k-folds 或其他一些交叉验证方法,所以这是否重要,因为它会通过交叉验证得到平均?
谢谢,
【问题讨论】:
-
你可能可以对它们进行管道化。
-
-
老实说,我不知道!文档有说明吗?
标签: python scikit-learn