选择正则化参数答案

【问题标题】：Choosing the regularization parameter选择正则化参数
【发布时间】：2014-01-05 02:35:53
【问题描述】：

应用正则化逻辑回归时：我将数据分成训练集、交叉验证集和测试集。我想应用正则化并正在选择正则化参数 lambda。为此，我尝试了不同的 lambda 值，并将我的假设的参数 theta 拟合到训练集上。然后，我选择在验证集上给我最低成本函数的 lambda 值。为此，我应该使用惩罚项还是不使用惩罚项来计算验证集的成本函数？

【问题讨论】：

标签： machine-learning logistic-regression regularized

【解决方案1】：

这是混淆了两件事。您最小化成本函数（带有正则化项）以选择模型参数（对于给定的超参数，如 lambda）。但是随后这些参数可以让您对验证集中的点进行分类。并且您测量分类与基本事实的匹配程度。您选择给出最正确答案的 lambda。带有 lambda 的成本函数在那个阶段不起作用。

【讨论】：

【解决方案2】：

你可以画出学习曲线，训练误差和验证误差都收敛到一个很小的值，并选择最小误差对应的参数作为正则化参数。

正则化参数的选择与代价函数值无关。

【讨论】：