参考《深度学习》花书。 推导L1实现参数稀疏性的原理,L2使得权重参数变小的原理。 字不好看,见谅啊。 相关文章: 2021-05-20 2021-05-21 2021-11-15 2021-07-21 2021-12-19 2021-05-01