【发布时间】:2020-11-22 17:49:11
【问题描述】:
我有一个音频频谱图的 2D numpy 数组,我想将其保存为图像。
我正在使用librosa 库来获取光谱。我还可以使用librosa.display.specshow() 函数绘制它。如下所示,有多种不同的缩放类型。
import PIL
import librosa
import librosa.display
def display_spectrogram(spectrum, sampling_rate):
"""
Frequency types:
‘linear’, ‘fft’, ‘hz’ : frequency range is determined by the FFT window and sampling rate.
‘log’ : the spectrum is displayed on a log scale.
‘mel’ : frequencies are determined by the mel scale.
‘cqt_hz’ : frequencies are determined by the CQT scale.
‘cqt_note’ : pitches are determined by the CQT scale.
"""
librosa.display.specshow(spectrum, sr=sampling_rate, x_axis='time', y_axis='log')
plt.colorbar(format='%+2.0f dB')
plt.title('Spectrogram')
plt.show()
我还可以将频谱图(一个 numpy 数组)转换为图像并保存如下。
img = PIL.Image.fromarray(spectrum)
img.save("out.png")
我有原始的频谱图(线性缩放),我想用对数刻度的 y 轴保存它。我查看了 library's source code 以了解它是如何扩展的,但无法弄清楚。
如何记录缩放图像/二维 numpy 数组的 y 轴?
【问题讨论】:
-
@Antimon 我不想改变这些值,我只想对数挤压它们。
-
没关系,我误解了你的问题。我现在知道了。但是您必须告诉我们数字数据的格式是什么。频率和时间点如何编制索引?
标签: python numpy python-imaging-library librosa spectrogram