Librosa：MFCC 特征计算

【问题标题】：Librosa : MFCC feature calculationLibrosa：MFCC 特征计算
【发布时间】：2016-11-04 02:09:39
【问题描述】：

给定22 mins (1320 secs) 的音频文件，Librosa 通过以下方式提取 MFCC 特征 data = librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, **kwargs)

data.shape (20,56829) 它返回 56829 帧的 20 个 MFCC 特征的 numpy 数组。

我的问题是它是如何计算 56829 的。有没有什么计算可以实现这个框架？每帧的窗口大小是多少？

【问题讨论】：

【解决方案1】：

你可以指定跳跃长度

mfcc = librosa.feature.mfcc(y=y, sr=sr, hop_length=hop_length, n_mfcc=13)

librosa 使用居中帧，因此第 k 帧以样本 k * hop_length 为中心

我认为默认跃点值为 512，您的数据为 (1320*22050)/56829 = 512,16

【讨论】：