【问题标题】:How to get predictions for each set of parameters using GridSearchCV?如何使用 GridSearchCV 获取每组参数的预测?
【发布时间】:2018-03-18 01:40:50
【问题描述】:

我正在尝试使用带有以下代码的 GridSearchCV 找到 NN 回归模型的最佳参数:

param_grid = dict(optimizer=optimizer, epochs=epochs, batch_size=batches, init=init
grid = GridSearchCV(estimator=model, param_grid=param_grid, scoring='neg_mean_squared_error')
grid_result = grid.fit(input_train, target_train)

pred = grid.predict(input_test)

据我了解,grid.predict(input_test) 使用最佳参数来预测给定的输入集。有没有办法使用测试集来评估每组参数的 GridSearchCV?

实际上,我的测试集包含一些特殊记录,我想测试模型的通用性以及准确性。谢谢你。

【问题讨论】:

    标签: python machine-learning neural-network regression grid-search


    【解决方案1】:

    您可以将GridSearchCV 的标准 3 倍 cv 参数替换为自定义迭代器,这会产生串联的训练和测试数据帧的训练和测试索引。结果,在进行 1 倍交叉验证时,您将在 input_train 对象上训练您的模型,并在 input_test 对象上测试您的拟合模型:

    def modified_cv(input_train_len, input_test_len):
        yield (np.array(range(input_train_len)), 
               np.array(range(input_train_len, input_train_len + input_test_len)))
    
    input_train_len = len(input_train)
    input_test_len = len(input_test)
    data = np.concatenate((input_train, input_test), axis=0)
    target = np.concatenate((target_train, target_test), axis=0)
    grid = GridSearchCV(estimator=model, 
                        param_grid=param_grid,
                        cv=modified_cv(input_train_len, input_test_len), 
                        scoring='neg_mean_squared_error')
    grid_result = grid.fit(data, target)
    

    通过访问grid_result.cv_results_ 字典,您将在测试集上看到所有指定模型参数网格的指标值。

    【讨论】:

      猜你喜欢
      • 2019-03-17
      • 2016-05-25
      • 2021-10-18
      • 2020-12-21
      • 2019-08-30
      • 2020-07-28
      • 2020-05-10
      • 1970-01-01
      • 2020-01-28
      相关资源
      最近更新 更多