【发布时间】:2018-05-19 19:36:51
【问题描述】:
我正在做 sklearn 作业,但我不明白为什么要使用训练均值和 sd 对测试数据进行标准化和规范化。如何在 Python 中实现这一点? 这是我对火车数据的实现:
digits = sklearn.datasets.load_digits()
X= digits.data
Y= digits.target
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3,train_size=0.7)
std_scale = preprocessing.StandardScaler().fit(X_train)
X_train_std = std_scale.transform(X_train)
#X_test_std=??
对于火车我认为是正确的,但是对于测试呢?
【问题讨论】:
标签: python scikit-learn normalization