【发布时间】:2019-11-16 14:27:35
【问题描述】:
我想提取以 8000 Hz 采样的音频文件的 mfcc 特征,帧大小为 20 ms,重叠时间为 10 ms。 librosa.feature.mfcc() 函数的参数必须是什么。下面写的代码是否指定了 20ms 的块与 10ms 的重叠?
import librosa as l
x, sr = l.load('/home/user/Data/Audio/Tracks/Dev/FS_P01_dev_001.wav', sr = 8000)
mfccs = l.feature.mfcc(x, sr=sr, n_mfcc = 24, hop_length = 160)
音频文件为 1800 秒。这是否意味着我会为所有 (1800/0.01)-1 块音频获得 24 个 mfcc?
【问题讨论】:
标签: feature-extraction mfcc librosa