论文 GroupFace: Learning Latent Groups and Constructing Group-based Representations for Face Recognition中,提供了一新型细粒化识别方法,并刷新了多项目SOTA
算法思路简洁但不失华丽,这里对该算法主体思路做简述
直接上图,算法主体思路是典型的注意力机制,backbone后,两条分支,一条用于输出N条组语义向量,一条用于输出N条语义向量的加权系数,很像SEnet,但作者对加权系数向量的抽象含义做了进一步的约束,加权系向量类似于一个小型分类网络输出结果,而实验结果也验证,该分类结果拥有具体的物理含义,比如检出人脸是否为光头,笑脸等。
此时网络又可以理解为,输出的加权系数向量是一种粗分类的结构,而对应的N条组语义向量则是粗分类的具体描述,具体的,我粗分类出这张人脸是一个光头,组语义向量则具体描述是一个什么样的光头,全光还是半光,有没有打蜡,而这一思路又让我联想到了一篇工业zero shot learning的方法Fault Description Based Attribute Transfer for Zero-Sample Industrial Fault Diagnosis,有兴趣的同学可以去了解一下
论文最后使用了arc face loss训练整个网络。
论文链接https://arxiv.org/pdf/2005.10497.pdf