MFCC提取:
opensmile工具箱
官方的opensmile文档提取的MFCC压根打不开,所以在此就需要该官方的配置文件,opensmile-2.3.0/config/MFCC12_0_D_A.conf
(官方的配置文件对提取的语音特征都有着详细的说明,每一个conf文件提取的特征都有所不同,根据自己需要来修改)
1、进入opensmile-2.3.0/bin/Win32后,按住shift键,再右击鼠标选择“在此处打开命令窗口(W)”
2、输入命令SMILExtract_Release -C C:\Users\HQ\Desktop\opensmile-2.3.0\config\MFCC12_0_D_A.conf -I F:\201.wav -O F:\mfcc.csv
对上述命令行解释一下:
SMILExtract_Release -C 这个部分不需要做任何改变
C:\Users\HQ\Desktop\opensmile-2.3.0\config\MFCC12_0_D_A.conf 这个是配置文件MFCC12_0_D_A.conf的路径
-I F:\201.wav 输入的语音样本, -I 不能少, 样本的路径可以根据自己的样本路径修改
-O F:\mfcc.csv 输入的特征值, -O B不能少, 特征值路径可以根据自己需要进行修改
上述已MFCC为例,其余的特征均可以修改配置文件(.conf)来获取相关的语音特征。
到此opensmile提取特征及基本结束。
注意:在之前说过官方的MFCC配置文件MFCC12_0_D_A.conf提取的mfcc.csv无法打开,
修改后的MFCC12_0_D_A.conf地址:http://download.csdn.net/download/heqiang525/10155573
打不开:
Ok了: