【发布时间】:2020-11-27 08:28:40
【问题描述】:
我目前正在尝试将 mel 频谱图转换回音频文件,但是,librosa 的 mel_to_stft 函数需要很长时间(最多 15 分钟)才能读取以 384kHz 采样的 30 秒 .wav 文件。
以下是我的代码:
# Code for high pass filter
def butter_highpass(cutoff, fs, order=5):
nyq = 0.5 * fs
normal_cutoff = cutoff / nyq
b, a = butter(order, normal_cutoff, btype='high', analog=False)
return b, a
def butter_highpass_filter(data, cutoff, fs, order=5):
b, a = butter_highpass(cutoff, fs, order=order)
y = filtfilt(b, a, data)
return y
def high_pass_filter(data, sr):
# set as a highpass filter for 500 Hz
filtered_signal = butter_highpass_filter(data, 500, sr, order=5)
return filtered_signal
example_dir = '/Test/test.wav'
sr, data = wavfile.read(example_dir)
des_sr = 44100
data_resamp = samplerate.resample(data, des_sr/sr, 'sinc_best')
data_hp = high_pass_filter(data_resamp, des_sr)
mel_spect = librosa.feature.melspectrogram(y=data_resamp, sr=des_sr)
S = librosa.feature.inverse.mel_to_stft(mel_spect)
y = librosa.griffinlim(S)
【问题讨论】:
-
你确定它的 mel_to_stft 需要花费时间,而不是 griffinlim 调用吗?
-
通过转换为 mel-spectrogram 然后再返回波形,您的目标是什么?在给出的示例中,我没有看到(mel)光谱域有任何进展
-
@jonnor 我可以确认是逆运算本身需要很长时间:更准确地说,是对
librosa.util._nnls的调用
标签: python audio spectrogram librosa mfcc