【发布时间】:2016-03-20 09:19:42
【问题描述】:
如果我们有一个近似函数 y = f(w,x),其中 x 是输入,y 是输出,w 是权重。根据梯度下降规则,我们应该根据 w = w - df/dw 来更新权重。但是我们是否可以根据 w = w - w * df/dw 来更新权重?有没有人见过这个?我想这样做的原因是因为在我的算法中这样做更容易。
【问题讨论】:
-
简而言之 - 不,这不是一个有效的渐变,你不能只是组成方程式并将它们插入:-)
标签: optimization machine-learning gradient-descent