本篇主要内容就是矩阵标量函数的求导,基本思路就是: 给标量函数套上迹trace; 利用迹和矩阵微分的性质进行化简,化简到df=tr((∂f∂x)Tdx)df=tr((∂f∂x)Tdx)就可以了 然后就可以得到∂f∂x∂f∂x了 因此,在深度学习中,假如loss是L2 Norm,也就是f=loss=‖‖aN−y‖‖22f=loss=‖aN−y‖22,那么∂f∂aL=2(a−y)∂f∂aL=2(a−y) 下面贴上参考资料: 相关文章: 2022-12-23 2022-12-23 2022-01-10 2021-09-10 2021-12-10 2021-12-15 2022-12-23 2022-12-23