1.背景
常见的分类损失函数可以概括为减小类内距离sn,增大类间距离sp。优化目标如下:
min(sn−sp)
2.存在的问题
- 优化不够灵活。
优化目标对sn和sp的惩罚作用是相等的,二者的系数都为1。
例如{sn,sp}={0.1,0.5}。这个时候类内距离sn=0.1,接近0,模型已经能够很好的将相同的类聚在一起。但由于此时sp=0.5,受sp的牵累,sn依然会接受一个较大的惩罚梯度。
- 收敛状态模糊。
记margin=sn−sp
考虑两个状态。T={sn,sp}={0.2,0.5},T1={0.4,0.7}虽然T和T1收敛状态是一样的,margin都是0.3,但此时0.5和0.4已经十分接近,即T时候的类间距离和T1时候的类内距离是差不多的,这种收敛状态会破坏特征空间的可分离性(不同类间的边界相互耦合,不够清晰)。
3.动机
针对上述两个challenge,给sn 和 sp加上不同的惩罚系数,优化目标变为:
min(α∗sn−β∗sp)
ps:决策边界从常见方法的直线变为本文方法的环形,故取名为circle loss。

相关文章: