【问题标题】:cs231n Convoluted Neural networlscs231n 卷积神经网络
【发布时间】:2016-11-07 02:49:48
【问题描述】:

我正在观看斯坦福大学 CS 231n 的在线讲座。我有一个问题,也许我出于某种原因感到困惑。链接是: the video

转到35:46,在backward函数中,dx的公式为:

dx = self.y * dz. 

我没有得到,因为

z = x*y. 

所以

dx = dz/y

谁能解释一下为什么会发生这种差异?

【问题讨论】:

    标签: computer-vision conv-neural-network calculus


    【解决方案1】:

    这只是他的代码中的一个奇怪的符号(dz,dx,dy 在他们通常的意义上没有使用)。这里的变量dz表示成本函数L(完整的神经网络)关于z的导数,而L 关于 xy 记为 dxdyz 相对于 x,即 y,由 self.y 简单地给出。考虑到这些符号,其余的遵循链式规则。

    【讨论】:

    • 所以,如果我错了,请纠正我。 dx 不是 z 对 L (dL/dz) 的影响和 y 对 x 的局部梯度(影响)的乘积(只不过是 y)。这是正确的吗?
    • dx 是 z 对 L 的影响与 x 对 z 的影响的乘积。神经元计算 z=x*y,所以 x 和 y 都会影响 z,但 y 绝不会影响 x。我希望这会有所帮助!
    • 现在很有意义。你的解释,只是回到它是完全有道理的。谢谢。
    猜你喜欢
    • 2017-01-01
    • 1970-01-01
    • 2020-11-01
    • 2020-10-07
    • 2020-10-19
    • 2020-10-19
    • 2018-05-01
    • 2020-08-20
    相关资源
    最近更新 更多