【问题标题】:how extract features from mfcc coefficients如何从 mfcc 系数中提取特征
【发布时间】:2014-03-19 18:24:07
【问题描述】:

我已经成功提取了 MFCC 系数,并且得到了以下值

  -15.2366
    6.4996
   -2.1807
    0.2495
   -1.3403
    0.9815
   -0.1106
    1.7914
    0.7311
    1.1881
    1.3340
    2.6080
    1.4208
    2.0144
    0.5085
   -1.1236
   -1.2728
   -0.9470
   -0.8139
    0.8987
    1.6006
    1.6000
    0.4638
    0.3747
    0.0670
   -0.0620
    0.6234
    0.0614
    0.0964
    0.2334
   -0.2188
    0.0591
    0.6765
    0.3943
   -0.1409
    0.1894
    0.0004
   -0.4762
   -0.1273
    0.1655
   -0.0649
   -0.2606
    0.0075
   -0.1275
   -0.2038
   -0.1332
    0.2084
    0.5128
    0.8877
    0.5406

现在如何从这些值中提取特征。 谢谢

【问题讨论】:

    标签: speech-recognition feature-extraction mfcc


    【解决方案1】:

    MFCC 已经是您必须用来训练识别引擎(通常是 HMM)的功能。

    但是,您是如何提取这些特征的? 我假设该向量代表您正在处理的音频文件中单个 100 毫秒窗口的 MFCC,因为典型的 MFCC 看起来像一个 N×M 矩阵。 N 是您用于提取特征的窗口数,M 取决于您提取 MFCC 的方式(通常 M=39)。

    【讨论】:

      猜你喜欢
      • 2020-09-21
      • 2019-11-16
      • 2014-07-03
      • 2018-06-13
      • 2015-04-09
      • 2019-06-07
      • 2016-09-23
      • 1970-01-01
      • 2016-05-15
      相关资源
      最近更新 更多