如何从 Deeplearning4J 的 org.datavec.audio.Spectrogram 生成频谱图像？答案

【问题标题】：How to generate spectrogram image from Deeplearning4J's org.datavec.audio.Spectrogram?如何从 Deeplearning4J 的 org.datavec.audio.Spectrogram 生成频谱图像？
【发布时间】：2018-09-20 12:32:19
【问题描述】：

我正在寻找在 Android 应用中生成频谱图图像的方法。我发现this project 似乎完成了所需工作的一半：它加载音频文件并在给定时间和频率创建一个二维强度数组。但是，现在我有点迷茫：如何从这些数据中生成人类可见的图片？

据我了解，它将涉及将强度值从 [-1,1] 浮点范围映射到像素颜色。但是作为音频处理的菜鸟，我不知道其他应用程序是如何做到的。

我不是在寻找确切的代码：我很感激只是对一般方法的描述。

【问题讨论】：

标签： java spectrogram deeplearning4j

【解决方案1】：

该库提供函数public double[][] getNormalizedSpectrogramData() 来返回音频频谱图数据，这是标准化的数字数据（介于 0 和之间）。

返回值第一索引是样本数，第二索引是频率范围值（我可能不对，欢迎指正！）。

有很多方法可以显示这个，我在 JavaFX 中创建了一个工作示例：

import javafx.event.ActionEvent;
import javafx.scene.image.ImageView;
import javafx.scene.image.PixelWriter;
import javafx.scene.image.WritableImage;
import javafx.scene.paint.Color;
import org.datavec.audio.Wave;
import org.datavec.audio.extension.*;

import java.io.InputStream;

public class Controller {
    public ImageView imgDisplay;

    public void loadMusic(ActionEvent actionEvent) {
        InputStream is = getClass().getResourceAsStream("/sounds/oxp.wav");
        Wave wave = new Wave(is);
        Spectrogram sptr = new Spectrogram(wave);

        double[][] spData = sptr.getNormalizedSpectrogramData();
        WritableImage resImg = new WritableImage(spData.length,spData[0].length);
        PixelWriter pxWr = resImg.getPixelWriter();

        int x = 0, y = 0;
        for(double[] col : spData) /* or row?! */
        {
            y = 0;
            for(double item : col)
            {
                resImg.getPixelWriter().setColor(x,y, Color.rgb((int)(item * 255),(int)(item * 255),(int)(item * 255)));
                y++;
            }
            x++;
        }

        System.out.println("Done! Image size is: " + x + "," + y);
        imgDisplay.setFitWidth(x);
        imgDisplay.setFitHeight(y);
        imgDisplay.setImage(resImg);
    }
}

【讨论】：