A Discriminative Feature Learning Approach for Deep Face Recognition
Y. Wen, K. Zhang, Z. Li, & Y. Qiao, A Discriminative Feature Learning Approach for Deep Face Recognition, ECCV, 2016
摘要
(1)中心损失(center loss):学习各个类别的深度特征的中心,同时对类内深度特征空间的尺度加以惩罚(simultaneously learns a center for deep features of each class and penalizes the distances between the deep features and their corresponding class centers)
(2)中心损失可训练且易于优化
(3)归一化指数损失、中心损失联合监督(joint supervision of softmax loss and center loss),使得类间分布分散、类内分布紧密(inter-class dispersion and intra-class compactness)
1 引言
对于面部识别任务,提取的深度特征不仅可分(separable),还要可鉴别(discriminative)、泛化能力强(generalized enough)。
可鉴别意味着:减小类内变化并增大类间差异(compact intra-class variations and separable inter-class differences)
(1)中心损失函数能提高深度特征的判别能力。
(2)各类深度特征中心:在训练过程中,更新中心位置,使深层特征与相应类别中心的间距最小。
(3)归一化指数损失、中心损失联合监督,通过超参数平衡。
(4)归一化指数损失使不同类别的深层特性分离;中心损失使相同类别的深层特性靠近其类别中心。
2 相关工作
3 本文方法
3.1 简单示例
MNIST:2维深度特征
归一化指数(softmax)损失:
其中,表示样本的深度特征,表示样本的类别,表示特征的维度,表示输出全连接层权值矩阵的第列,表示偏置项。
3.2 中心损失(center loss)
提升深度特征(deeply learned features)鉴别能力(discriminative power)的关键在于:保证不同类别特征可分的前提下,最小化类内差异。中心损失(center loss)定义为:
其中,表示类别深度特征中心,该方程能够最小化类内差异。训练时,随深度特征的变化而变化,其学习率为。
其中,
归一化指数损失、中心损失联合监督损失函数(joint supervision of softmax loss and center loss)为:
超参数用于平衡归一化指数损失和中心损失。
判别特征学习算法
3.3 讨论
-
联合监督的必要性(the necessity of joint supervision)
归一化指数损失:增大类间距离;中心损失:减小类内距离(intra-class variations) -
与反差损失、三元组损失比较(compared to contrastive loss and triplet loss)
反差损失、三元组损失在构造样本对、样本三元组时,存在数据膨胀问题(dramatic data expansion);而联合监督损失无需额外构造数据;中心损失直接以类内紧致为学习目标。
4 实验
4.1 实施细节
-
预处理(preprocessing)
面部检测、5点关键点定位(landmarks)、5点仿射(similarity transformation)、样本正规化(normalized,)、RGB -
训练数据(training data)
合并CASIA-WebFace、CACD2000、Celebrity+数据集,并剔除出现在测试集中的用户,共包含17,189位用户和70万张面部图像。
数据增强:水平翻转。 -
CNN网络结构
caffe
模型A:归一化指数损失;模型B:归一化指数损失、反差损失;模型C:归一化指数损失、中心损失。
批尺寸:256;Titan X:2 GPUs;
模型A、C:28K次迭代,14小时;模型B:42K次迭代,22小时。 -
测度
深度特征为全连接层输出、PCA、余弦相似度、最近邻(nearest neighbor)、门限比较(threshold comparison)
4.2 参数和
:控制类内变异(intra-class variations)
:类中心学习率(learning rate of center )
4.3 LFW、YTF
模型C,、
4.4 MegaFace
MegaFace:评估面部识别算法在大量干扰条件(million scale of distractors)下的表现。
-
面部识别(face identification)
计算给定用户面部图像与库中面部图像间的相似度;用累积匹配特性(Cumulative Match Characteristics ,CMC)曲线(“Top-K”)衡量。
(横轴似乎反了)
“Top-1” -
面部认证(face verification)
验证给定的一对面部图像与是否为同一用户;计算真实接收速率(True Accept Rate,TAR)和虚假接收速率(False Accept Rate,FAR),绘制接收机的工作特性(Receiver Operating Characteristic,ROC)曲线。
FAR = 1e-6