语音流隐写分析

1.隐写

语音流隐写分析

VoIP 的编码器都使用代数码本激励线性预测 ( ACELP) 编码规则编码，这是一种混合编码形式。
主流方案是基于VoIP 编码器编码过程中的冗余提出的隐写方案：

在编码中检测某些参数属于最低有效位，然后篡改为秘密信息这种属于最低有效位LSB隐写，
而利用 VoIP 编码器的码本编码特性划分码本来隐藏信息的方法叫做量化索引调制QIM 隐写：按照语音编码本来的原则将码本以某种规则划分并选择次优参数来嵌入秘密信息。

2.隐写分析

在参数隐写的分类上按照编码参数种类进行分类

语音流隐写分析
编码之后得到的参数有线性预测(LPC) 参数，固定码本( FCB) 参数，自适应码本( ACB) 参数..
LPC，FCB，ACB 参数编码都是使用码本的参数编码，所以既可以使用 LSB 方式隐写又可以根据 QIM 方式隐写
对于隐写，提出的隐写方案更加侧重于隐写方法，其目的在于如何使提出的方法能够提高隐蔽性和隐藏容量。所以按照隐写手段来分类。
对于检测，不论使用的是何种方法，重要的是将其检测出来并且最好知道隐写的位置，因此，隐写分析会按照参数位置来分类。

3.隐写分析算法

4.基于语音载荷的隐写分析

4.1针对最低有效位LSB的隐写分析 4.2-4.4针对量化索引调制QIM的隐写分析

4.1所有参数的隐写分析

[80]采用了二次检测和回归分析，不仅能够检测嵌入在互联网协议( VoIP) 语音中的隐藏消息，而且能够准确地估计嵌入消息的长度。
[81]提出了一种能够捕获 Internet 上的VoIP 语音流并检测其中实时隐蔽信道的模型。
[82]提出了一种在 VoIP语音的分布式隐写分析方法。每个可用于隐藏信息的语音参数被设计成利用相应的最佳检测特征独立地检测。
[83]提出了一种基于二阶导数语音信号小波包系数的马尔可夫双向转移矩阵的隐写检测算法。此类检测方法具有一定的通用性，但是针对一些复杂的隐写方案并不能有效地检测。

5.2 线性预测参数LPC隐写分析

LPC 广泛应用于语音信号建模是 VoIP 编码器中重要的组成部分。
在 LPC 编码中，对 LPC 系数进行转换成线谱频率系数。
基于 LPC 参数的QIM 隐写就是在量化 LSF的过程中划分码本并嵌入秘密信息。
[84]提出了一种改进的 QIM 隐写算法用于G.729A 压缩语音流中的有效信息隐藏。
[85]基于量化指标序列中各量化指标( 码字) 的分布具有不平衡性和相关性的特点，提出检测G.723.1比特流QIM隐写的方法。[86]采用音素分布特征用来检测 QIM 隐写术。
[87]针对 LPC 上的隐写，观察到线性预测编码滤波器系数的分裂矢量量化码字的相关特性在QIM 隐写之后发生了变化，基于此，构造量化码字相关网络模型。值得注意的是，利用深度学习来构建隐写分析算法不仅在准确率而且在实时性上都优于传统算法。
[72]提出了一种有效的隐写分析方法来检测QIM隐写术。为了提取这些相关特征，提出了基于递归神经网络的码字相关模型。实验结果表明, 在短时间内这个隐写分析方法达到了非常好的效果。
[73]提出了一种基于码字贝叶斯网络的隐写分析方法。

5.3 固定码本参数FCB隐写分析

在编码中通过深度优先树获得固定码本向量。但是这个结果是次优的，因此，对于所需的码本向量还有其他替代方案。利用这一特性，现有的隐写方法将隐写操作结合到码本搜索中实现信息嵌入。对于这种隐写方法的检测往往是根据脉冲之间的一些特性来区分原始样本和隐写样本。
[88]提出了一种基于脉冲位置参数直方图特征的合成压缩语音隐写分析方法。
[89]认为脉冲位置等参数的取值存在一定的局限性，基于此提出一种针对 G.723.1 网络语音协议( VoIP) 压缩语音的隐写分析方法。
[90]针对固定码本上的隐写提出了2种隐写分析方法: ①利用马尔科夫转移概率来据估计轨迹中脉冲位置之间的关系; ②使用联合熵与条件熵来测量脉冲位置的不确定性。
[76]提出基于相同脉冲位置概率的隐写分析特征的隐写分析方法。
[91]提出利用脉冲位置的概率分布和语音信号的短时不变特性，提取脉冲位置的马尔可夫转移概率，并采用联合概率矩阵来表征脉冲-脉冲相关性，提出一种新的隐写分析方法。
[77]又使用脉冲对的概率分布和脉冲对的马尔科夫转移概率矩阵以及脉冲对的联合概率矩阵作为轨道与轨道相关性特征，使用 AdaBoost 进行特征筛选精简得到的特征分类结果优于现有的检测方法。
针对 FCB 隐写率未知的问题，Tian 等［78］提出了 3 种基于支持向量机的隐写分析方法，然后提出了一个混合隐写分析方案，并提供一个综合的检测结果。目前，基于 FCB 参数隐写的检测方法在检测精度上已经达到较好的效果，但是在可拓展性和通用性上仍有提升的可能。

5.4 自适应码本参数ACB隐写分析（难）

自适应码本搜索的目的是预测基音周期，基音周期是VoIP编码器中一个很重要的参数。由于编码的冗余，很多隐写方法使用LSB 或者QIM 方法将原值修改嵌入信息。针对这类的隐写分析难度较大。
基音调制信息隐藏是在基音预测中嵌入秘密信息，在低比特率语音编解码器中能以较高的隐蔽性和带宽来隐藏信息。
但是，压缩语音流中相邻语音帧自适应码本具有一定的相关特性。根据这一发现
[74]采用码本相关特性作为基音调制隐写检测的特征，并设计了码本相关网络模型得到较好的实验效果。
[75]提出了一种新的 AMR 音频隐写检测方案，基于原始的与隐写的 AMR 音频对相邻音高延迟连续性的区别，通过计算马尔科夫转移概率，提出音调延迟二阶差分矩阵( matrix of the second-order difference of pitch delay，MSDPD) 隐写分析特征矩阵，再通过校准MSDPD 得到C-MSDPD，实验证明 C-MSDPD 的效果要优于[74]的效果，是已知最优的检测方法。

5.提升

1) 提高隐写分析检测准确率：从提高分类器的性能出发也是升检测效果的方向。将深度学习方法应用到隐写分析中并且达到了较好的效果，检测准确率仍然有上升的空间。
2）隐写分析的通用性。通用不仅仅要做到对某一类型的隐写方法的检测( 其中包括未知隐写方法的检测) ，而且做到要对不同编码环境下隐写的检测。除此之外，由于样本集大小的限制，一般隐写分析算法可能对一些样本集并不能达到较好的效果，这些都是通用的范围。一方面需要研究提高分类器的泛化能力，另一方面需要研究组建针对不同条件的集成分类器。