1、如何度量两个分布的相似度

kl散度,分布的对数差异的数学期望(两个分布在所有取值上的加权平均)。

2、极大似然估计可以看作最小化模型分布的kl散度距离等价。

使得对数似然函数最大>等价转换(引入负号)>引入常数项>相除形式>kl散度定义

gan 的要点 (弱点与改进、推土距离)

3 、kl散度作为损失函数的模式塌陷问题:因为p(x)为其中一个分布的加权,所以不具有对称性,假设p(x) q(x)一个为单峰、一个为双峰,用双峰逼近的时容易忽视其中一个。通常改用js散度。(假设10个模式,有可能只生成其中几种模式,丢失其他模式)

4、gan的损失函数改进之一:加log。(虽然该方法在wgan中被批判),把目标函数的值域拉大。

5、在最优判别器下,gan定义的生成器loss可等价变换为最小化真实分布与生成分布之间的js散度。

(真、假样本混合可以找出真的样本)

gan 的要点 (弱点与改进、推土距离)

6、推土机距离(绝妙,纳什平衡依据)(最优路径规划最小消耗)(接近于连续,js、kl有突变、空间不要有悬崖)

1)取log的问题 导致没有上界;判别器参数绝对值截断(lipschitz连续)

2)解决训练不稳定 (dc gan碰巧平衡生成、判别器)判别器过快最优,梯度为0

3)解决模型崩溃,生成多样性。

4)gan最优判别器下,p(r)和g(g) 真实的分布和造出来的分布可能没有重合,梯度消失

gan 的要点 (弱点与改进、推土距离)

 

相关文章:

  • 2021-07-26
  • 2021-08-20
  • 2021-09-06
  • 2021-11-21
  • 2021-09-25
  • 2022-12-23
  • 2021-12-02
猜你喜欢
  • 2022-12-23
  • 2021-12-31
  • 2021-06-22
  • 2021-08-05
  • 2021-10-14
  • 2021-05-26
相关资源
相似解决方案