PoseGait：A model-based gait recognition method with body pose and human prior knowledge

Related work

基于外观的识别方法：

常见的输入数据形式最常见的是GEI。对GEI的处理方式一般为：

1)从视频中提取人体轮廓;
2)通过轮廓对齐和平均计算步态能量图像GEI;
3)然后计算两个GEIs之间的相似关系

也有直接使用剪影的方法，如Gaitset。

但是基于外观的识别方法主要的挑战是角度 / 载荷 / 衣物 / 遮挡等，它们会改变人的轮廓。

基于模型的方法

先建立人体的模型，根据输入数据得到模型参数，而后对模型参数变化进行分类。

难点在人体模型的定位精度以及计算量。

对人体模型的抽象方式和特征表达：

[1] by Nixon 一个简单的棍模型来模拟腿，然后用一个清晰的钟摆运动来模拟腿在走路时的运动。将频率分量作为步态特征进行识别。
Wang et al. [3] 认为关节角度的时域变化可以用于识别。提出多连接刚体模型，将刚体分为14个部分，每个部分通过一个关节连接。
Feng等人 [12] 从人体关节提取时间特征，使用从RGB图像而非剪影中提取的人体关节热图来描述人体姿态
Kastanio- tis等人[13] 使用来自低成本Kinect传感器的骨架数据。但是监控常见的还是RGB图像

PoseGait

认为3D的姿态信息比轮廓信息维度更低且更加紧凑。

使用了四种特征(3D姿态+关节角度+肢体长度+关节动态，其中后三种是handcrafted)，拼接之后作为输入数据（在输入之前拼接）。

人体姿势特征

图片是2D的，所以进行特征点定位和姿态估计的时候，先得到2D的模型

1.二维模型的获取

文章使用的是OpenPose [6] .它可以从二维的图片/视频中得到18个关节点：

鼻、颈以及左右的肩、肘、腕、髋、膝、踝、眼、耳

PoseGait：A model-based gait recognition method with body pose and human prior knowledge

为了防止目标与摄像机距离对结果的影响，会进行归一化：

颈部和臀部之间的距离被视为单位长度。
臀部的位置是在左臀点和右臀点的中心。
颈部位于平面坐标系的原点。

换算方法：

PoseGait：A model-based gait recognition method with body pose and human prior knowledge

2. 三维模型的获取

当视图被改变时，2D的姿态也会发生巨大的变化。所以它对试点的变化是不稳健的。解决方法是从二维姿态来估计三维姿态。[18]的独特优势在于它可以从单幅图像中估计出三维姿态，特别是通过人体约束得到的二维姿态。

2维向3维的转化方法：在[18]中，输入数据应该是14个关节的位置。openpose给出的是18个，故将头部的各点进行平均作为头部坐标。

视角归一化：将x方向设置为受试者的正面方向，将y方向设置为由左肩和右肩定义的身体一侧，将z方向设置为与地面垂直的方向。将三维位姿在该三维空间中旋转并归一化。

时空特征

基于先验知识的特征减轻深度神经网络的任务。受特征关节的启发，设计了三种附加的时空位姿特征：

关节角，即某些关节处变化的角度；
肢体长度，人体静态测量;
关节运动，用动态特征来描述运动模式。

1.关节角度

下肢关节角度的变化有利于步态识别。

三维角度的计算方法：

PoseGait：A model-based gait recognition method with body pose and human prior knowledge

2.支干长度

肢体长度是两个相邻关节之间的距离。对载荷、角度、衣着不敏感

PoseGait：A model-based gait recognition method with body pose and human prior knowledge

每个人体骨骼模型有13个静态肢体长度。

3.关节动态

利用帧间差异来获取动态信息。关节运动由两个相邻帧之间的差来定义，帧c和帧c+1：

PoseGait：A model-based gait recognition method with body pose and human prior knowledge

特征拼接

这四个向量可以连接成一个长向量来表示姿势、运动和静态身体测量。不同帧的特征向量可以组合在一起形成特征矩阵，如图5所示。

但是因为动态信息 f_motion是两帧差分得到的，所以数量会少于其他三个，解决办法是用一个零向量使矩阵完备。

PoseGait：A model-based gait recognition method with body pose and human prior knowledge

网络结构

由于特征是逐帧提取的，并且是序列数据，因此对序列数据采用RNN[23]和LSTM[24]的方法是合理的。

有两种损耗，Softmax Loss 和 center loss。

Softmax Loss 可以将输入分为不同的类别。这意味着softmax的损失会扩大类间差异。
center loss 可以通过最小化类内变化来保持不同类的特征可分离。

PoseGait：A model-based gait recognition method with body pose and human prior knowledge

λ = 0.008

PoseGait：A model-based gait recognition method with body pose and human prior knowledge

实验

实验数据和设置：

CASIA B步态数据集

这个数据集比较熟悉了。

训练集：前62名受试者，

测试集：其余受试者。

受试者测试方法：gallery集由每个受试者的前4个正态行走序列组成

probe集由其余序列组成

PoseGait：A model-based gait recognition method with body pose and human prior knowledge

对比实验：SPAE[8]和GaitGAN[34]

CASIA E步态数据集

是由中国科学院和Watrix公司共同开发的最新步态数据集。该数据集包含1014名受试者，比CASIA b大得多。与其他超过1000名受试者的步态数据集不同，步态数据是从13个不同视角收集的。视图从0到180，在水平方向上有15个间隔。每个受试者有6个序列。分别为正常步行(NM)、带包步行(BG)和穿外套步行(CL)的2个序列。正在处理隐私问题，稍后会发布数据集。

实验设置类似于在CASIA B。

训练集：CASIA E数据集的前507名受试者,和被放入

测试集：剩下507名受试者。测试集,有两种类型的设置。

对于相同视点条件下的正常行走，同一视点上只有两个正常行走序列。gallery为第一个正常行走序列，probe为第二个正常行走。
在第二种设置中，将前2个正常行走序列放入gallery中，将其余行走序列放入probe中。

PoseGait：A model-based gait recognition method with body pose and human prior knowledge

Related work

PoseGait

人体姿势特征

时空特征

1.关节角度

2.支干长度

3.关节动态

特征拼接

网络结构

实验

CASIA B步态数据集

CASIA E步态数据集