目录
语音信号的时域分析是直接对语音波形进行处理或者估计得到一系列随时间变化的特征。时域分析建立在语音的短时不变性的基础之上,即在较短时间内语音各种特性是不变的。为了进行短时分析,需要将语音进行分帧,每一帧会有部分重叠,如下图所示。
一般通过窗函数将语音分帧,常用的窗函数有矩形窗和汉明窗,其中矩形窗定义为:
在矩形窗中,所有采样点的权值是一样的均为1,其时域形状和频域响应分别如下:
汉明窗定义为:
在汉明窗中,中间部分的采样点权值会增大,起始和终止部分采样点权值会削减,其时域形状和频域响应分别如下:
1. 短时能量
长时能量定义为采样点幅值的平方和,即
但是长时能量不能反应太多有用的信息,因此对信号进行加窗得到短时能量的计算公式为:
计算流程可以示为
2. 短时幅值
由于短时能量由于采用平方计算导致其对大信号值的影响,因此提出短时幅值表示“伪能量”,其定义为:
计算流程为:
3. 短时过零率
过零率是一种简单估计频率相关内容的方法,其计算公式为:
其中sgn(x)为符号函数,其定义为:
计算流程为:
在实际应用中,我们需要计算每M个采样间隔的过零率,即
此时ZM与采样率无关,可以用作频带中的量度。
4. 短时自相关
对于确定信号,其自相关函数定义为:
对于随机信号或者周期信号,其自相关函数定义为:
短时自相关可以对上述函数加窗得到,此时,确定信号的自相关函数为:
计算流程为:
为了解决对于不同的k中,自相关结果中采样点数量不同的问题提出了修正自相关函数,其定义为:
其中w1为标准长度为L的窗,w2为长度为L+K的窗,对于矩形窗来说有
5. 短时平均幅差
由于自相关需要进行乘法运算需要较大的时间开销,为了避免乘法运算,提出了短时平均幅差,即计算语音的幅度差值来代替自相关中的乘法运算,其定义为:
参考文献:
[1]. 胡航, 语音信号处理
[2]. UCBS, Digital Speech Process
语音信号处理交流群: 652292630