【问题标题】:How do Mel Frequency Cepstrum Coefficients work?梅尔频率倒谱系数如何工作?
【发布时间】:2010-12-09 19:37:30
【问题描述】:

我已经根据麦克风输入实时计算出 FFT 和音高 + 绝对频率。 现在我要计算音色。

我看到了 Mel Frequency Cepstrum Coefficients - MFCCs,但我不太了解它。 有人可以给我一些建议吗..

【问题讨论】:

    标签: algorithm voice frequency-analysis mfcc


    【解决方案1】:

    MFCC 结合了对人类听觉(对数频率感知,mel scale)和乐器物理(这些系统通常具有明确定义的泛音,harmonic)的考虑——这就是 MFCC 使用 FFT 的原因FFT),给出乐器音色的简化表示(其中基频和响度被考虑在内)。

    你可以写无数关于这个主题的页面,网上有很多可用的,所以一个更具体的问题可以清楚地解释你想知道的内容会很有帮助。计算 MFCC 的算法列在wikipedia page 的顶部。

    【讨论】:

    • 知道答案。所以如果我想获得音色,MFCC 是正确的方法吗?
    • 是的,我想是的,尤其是作为对这个问题的第一次攻击。它很容易实现,有很多关于它的文章,它是与其他方法进行比较的标准(通常在这些比较中表现良好),因此它是一个不错的选择。
    • 在 wiki 中,算法是: 1. 对信号(窗口摘录)进行傅里叶变换。 2. 使用三角形重叠窗口将上面获得的光谱的功率映射到梅尔标度上。 3. 记录每个梅尔频率的功率对数。 4. 对 mel 对数幂的列表进行离散余弦变换,就好像它是一个信号一样。 5. MFCC 是所得频谱的幅度。除了第 2 步,我什么都懂:使用三角形重叠窗口我应该怎么做,将频率传递给 mel 比例,但是这个三角形重叠窗口是什么?
    猜你喜欢
    • 2012-10-18
    • 2023-04-04
    • 2010-12-10
    • 1970-01-01
    • 2018-07-19
    • 2010-12-09
    • 2021-07-30
    • 2013-05-21
    • 1970-01-01
    相关资源
    最近更新 更多