【问题标题】:Mel Frequency Cepstrum Coefficients algorithmMel频率倒谱系数算法
【发布时间】:2010-12-09 23:22:04
【问题描述】:

我想获得一些音频的音色。

为了使用它,我将制作梅尔频率倒谱系数算法。

实现看起来很简单(我已经完成了第 1 步): 1. 对信号进行傅里叶变换(窗口摘录)。 2. 使用三角形重叠窗口将上面获得的光谱的功率映射到梅尔标度上。 3. 记录每个梅尔频率的功率对数。 4. 对 mel 对数幂的列表进行离散余弦变换,就好像它是一个信号一样。 5. MFCC 是得到的频谱的幅度。

在第 2 步中,我知道如何从频率传递到 mel 比例,但我不知道三角形重叠窗口是什么意思..

如何正确执行此步骤? 三角重叠窗是什么意思?

【问题讨论】:

    标签: algorithm voice frequency


    【解决方案1】:

    完成到 mel 音阶的转换后,应用一组沿此音阶均匀分布的重叠三角滤波器(因此低频间隔更紧密)。也就是说,这里您要从 FFT 返回的大致连续曲线到一组离散的 20-50 个离散值。

    我四处搜索过滤器的图片,并找到了一些(均为 pdf 格式)herehere(第 4 页)。这些还详细描述了它们如何进行计算的其他细节。

    【讨论】:

      猜你喜欢
      • 2013-05-21
      • 2010-12-09
      • 2010-12-10
      • 2012-10-18
      • 2020-03-03
      • 2012-02-28
      • 2023-04-04
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多