【发布时间】:2013-06-21 18:18:46
【问题描述】:
我通过在线资源(即 coursera 上的机器学习)学习了梯度下降。然而提供的信息只是说重复梯度下降直到它收敛。
他们对收敛的定义是使用成本函数相对于迭代次数的图表,并观察图表何时变平。因此,我假设我会做以下事情:
if (change_in_costfunction > precisionvalue) {
repeat gradient_descent
}
另外,我想知道确定收敛的另一种方法是否是观察系数接近它的真实值:
if (change_in_coefficient_j > precisionvalue) {
repeat gradient_descent_for_j
}
...repeat for all coefficients
那么收敛是基于成本函数还是系数?以及我们如何确定精度值?它应该是系数的百分比还是总成本函数?
【问题讨论】:
-
收敛始终是优化变量中的“没有变化”(或太小的变化),在大多数情况下应该直接反映您的成本。
-
这里的精度值是多少?
标签: machine-learning gradient-descent