【发布时间】:2019-05-24 07:45:53
【问题描述】:
【问题讨论】:
标签: spectrogram mfcc librosa
【问题讨论】:
标签: spectrogram mfcc librosa
要获得 MFCC,请计算 mel 谱图上的 DCT。梅尔谱图之前通常是对数缩放的。
MFCC 是一种非常可压缩的表示,通常只使用 20 或 13 个系数,而不是梅尔频谱图中的 32-64 个波段。 MFCC 的去相关性更高,这对于高斯混合模型等线性模型可能是有益的。凭借大量数据和卷积神经网络等强大的分类器,梅尔谱图通常可以表现得更好。
【讨论】:
我想,乔纳的回答并不完全正确。有两个步骤:
1.获取梅尔谱图的日志。
2. 在日志上计算 DCT。
此外,获取日志似乎是训练 NN 的“主要部分”:https://qr.ae/TWtPLD
【讨论】:
一个关键的区别是 mel-spectrogram 具有频谱的语义,而 MFCC 在某种意义上是“频谱的频谱”。真正的问题是:将 DCT 应用于 mel 谱图的目的是什么,这有很好的答案 here 和 there。
请注意,同时 librosa 也有一个 mfcc 函数。而且看its implementation基本确认是
melspectrogram,power_to_db),n_mfcc 系数之后截断新的“频谱”。【讨论】: