1. 一般wav提取特征的方式:

语音特征提取: MFCC的理解

2. 什么是MFCC:

在mel-spectrum上取对数,再做傅里叶变换得到的特征,就是MFCCs。

这个过程可以概括为对mel-spectrum求倒谱。

3. 什么求倒谱:

求倒谱 就是对频谱取对数,再做傅里叶变换,又回去了。

实际上是为了获取频谱的包络,包络这个东西是非常用途很广。

4. 什么是频谱的包络:

就是频谱里面主要频率成分的连线的平滑曲线,就是一段声音里面频率振幅高的那些频率的连线。
包络就是频率主要成分振幅的变化。

5.如何获取频谱的包络:

包络就是频率主要成分振幅的变化。可以通过幅度解调的方法。就是这个变化是低频的。
对频谱做傅里叶变化,过滤低频的成分,就是包络的信息。

相关文章:

  • 2021-08-15
  • 2021-04-08
  • 2021-09-02
  • 2021-06-25
  • 2021-07-08
  • 2021-11-08
  • 2022-02-27
  • 2022-01-01
猜你喜欢
  • 2021-07-28
  • 2021-07-22
  • 2021-08-08
  • 2021-10-29
  • 2022-01-13
  • 2021-04-11
  • 2021-04-16
相关资源
相似解决方案