【发布时间】:2016-11-04 02:09:39
【问题描述】:
给定22 mins (1320 secs) 的音频文件,Librosa 通过以下方式提取 MFCC 特征
data = librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, **kwargs)
data.shape (20,56829) 它返回 56829 帧的 20 个 MFCC 特征的 numpy 数组。
我的问题是它是如何计算 56829 的。有没有什么计算可以实现这个框架?每帧的窗口大小是多少?
【问题讨论】:
标签: python audio audio-processing mfcc