【问题标题】:Librosa - Audio Spectrogram/Frequency Bins to SpectrumLibrosa - 音频频谱图/频率分档到频谱
【发布时间】:2021-06-04 02:16:57
【问题描述】:

我已经阅读了几天,但一直没有找到解决方案...我能够使用以下方法构建 Librosa 频谱图并提取幅度/频率数据:

audio, sr = librosa.load('short_piano melody_keyCmin_110bpm.wav', sr = 22500)
spectrum = librosa.stft(audio, n_fft=2048, window=scipy.signal.windows.hamming)
D = librosa.amplitude_to_db(np.abs(spectrum), ref=np.max)
n = D.shape[0]
Nfft = 1+2*(n-1)
freq_bins = librosa.fft_frequencies(sr=sr, n_fft=Nfft)

但是,我无法将 D 和 freq_bins 中的数据转换回频谱。一旦我能够做到这一点,我可以将新频谱转换为 .wav 文件并收听我重建的音频......任何建议将不胜感激!谢谢。

【问题讨论】:

  • 要将基于 stft 的频谱转换回音频信号,您应该使用 istft。请注意,要转换回时域,您需要一个复值频谱,而不仅仅是绝对频谱。但是,您可以简单地尝试使用原始信号的相位。另请注意,根据您想要做什么,cqticqt 可能是更好的选择。
  • @Hendrik 感谢您的回复!我知道这些方法,但不知道如何将幅度转换为频谱......不确定它是否可能,但它似乎应该是其他类型的逆?
  • 使用stft 将幅度转换为频谱。它为您提供了一个复值频谱。保留相位并操纵这些值的大小。然后使用istft 转换回来。转换回依赖于Griffin/Lim-paper。这是一个经典,所以网上有很多容易理解的解释。祝你好运!
  • 这里有一个更好的论文链接:citeseerx.ist.psu.edu/viewdoc/…

标签: python audio librosa spectrogram


【解决方案1】:

当我正确回答您的问题时,您想根据幅度值重建实/虚频谱。为此,您将需要相位组件,然后是所有简单的复数运算。你应该知道STFT的输出是一个复数数组,幅度是每个数字的绝对值,而相位是每个数字的角度

这是一个时域信号在不修改的情况下转换为幅度/相位并返回的示例:

% get the complex valued spectrum from a sample
spectrum = librosa.stft(audio, n_fft=2048,window=scipy.signal.windows.hamming) 

# get magnitude and phase from the complex numbers
magnitude = np.abs(spectrum)
phase = np.angle(spectrum)

# reconstruct real/imaginary parts from magnitude and phase
spectrum = magnitude * np.exp(1j*phase)

# transform back to time-domain

在您的情况下,您当然应该首先将分贝值转换回幅度值。即使没有使用 librosa 的经验,我相信也有一个功能。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2020-06-23
    • 1970-01-01
    • 2020-01-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-05-07
    相关资源
    最近更新 更多