【发布时间】:2012-11-28 10:51:00
【问题描述】:
我正在尝试根据我找到的这篇论文 (http://arxiv.org/pdf/1003.4083.pdf) 计算 MFCC 算法,所以到目前为止我所做的是:
步骤1)预加重
步骤2)框架
步骤 3) 汉明窗口
步骤 4) 快速傅里叶变换
步骤 5) 梅尔滤波器组处理
步骤 6):离散余弦变换
基本上,我采用了 Mel Bank 滤波器并将它们与实际的原始信号相乘。然后我对这些结果执行 FFT,如下所示:
第 1 帧上的 FFT:
然后我计算了 FFT 的 DCT,结果如下所示:
第 1 帧的 DCT:
到目前为止,这看起来正确吗?有没有办法让我检查这一点,以便我知道我正在朝着正确的方向前进?
另外,我需要获得 13 个系数,但我不知道如何确定要获得哪些。我得到 256 个值,那么我要取前 13 个值吗?或者,我得到总能量了吗?
我希望有人可以帮助我。
【问题讨论】:
-
可能重复(同一用户?):dsp.stackexchange.com/questions/6232/…
标签: signal-processing speech-recognition mfcc