【发布时间】:2019-03-29 21:21:20
【问题描述】:
我有一个小数据集,我想尝试使用来自sklearn 的Multi-layer Perceptron regressor 预测相同变量的值。
这就是我正在做的:
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neural_network import MLPRegressor
X_train, X_test, y_train, y_test = train_test_split(X, Y)
scaler = StandardScaler()
scaler.fit(X_train)
X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)
mlp = MLPRegressor(hidden_layer_sizes=(10,10))
mlp = mlp.fit(X_train,y_train)
test_y = mlp.predict(X_test)
现在训练集由100 示例组成。我想做的是在75和25中将训练集拆分四次,以便用4不同的数据集训练相同的模型。
这就是我正在做的事情:
c1 = 0
c2 = 25
for i in range(0,4):
xt = X_train[c1:c2]
yt = np.setdiff1d(X_train, xt)
c1 = c2 + 1
c2 = c2 + 25
mlp = mlp.fit(xt ,yt)
【问题讨论】:
-
你说的是交叉验证吗?那么sklearn中的一些相关功能见this描述。
-
是的,请查看修改后的代码。
-
有什么问题?
-
@UmangGupta 问题:我是不是训练了四次同一个模型?
标签: python machine-learning scikit-learn neural-network