【问题标题】:Librosa : MFCC feature calculationLibrosa:MFCC 特征计算
【发布时间】:2016-11-04 02:09:39
【问题描述】:

给定22 mins (1320 secs) 的音频文件,Librosa 通过以下方式提取 MFCC 特征 data = librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, **kwargs)

data.shape (20,56829) 它返回 56829 帧的 20 个 MFCC 特征的 numpy 数组。

我的问题是它是如何计算 56829 的。有没有什么计算可以实现这个框架?每帧的窗口大小是多少?

【问题讨论】:

    标签: python audio audio-processing mfcc


    【解决方案1】:

    你可以指定跳跃长度

    mfcc = librosa.feature.mfcc(y=y, sr=sr, hop_length=hop_length, n_mfcc=13)
    

    librosa 使用居中帧,因此第 k 帧以样本 k * hop_length 为中心

    我认为默认跃点值为 512,您的数据为 (1320*22050)/56829 = 512,16

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-09-24
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-12-05
      • 1970-01-01
      相关资源
      最近更新 更多