【发布时间】:2010-12-09 23:22:04
【问题描述】:
我想获得一些音频的音色。
为了使用它,我将制作梅尔频率倒谱系数算法。
实现看起来很简单(我已经完成了第 1 步): 1. 对信号进行傅里叶变换(窗口摘录)。 2. 使用三角形重叠窗口将上面获得的光谱的功率映射到梅尔标度上。 3. 记录每个梅尔频率的功率对数。 4. 对 mel 对数幂的列表进行离散余弦变换,就好像它是一个信号一样。 5. MFCC 是得到的频谱的幅度。
在第 2 步中,我知道如何从频率传递到 mel 比例,但我不知道三角形重叠窗口是什么意思..
如何正确执行此步骤? 三角重叠窗是什么意思?
【问题讨论】: