【发布时间】:2023-03-22 20:09:02
【问题描述】:
我正在 android 上编写应用程序,为此我正在使用 Qt creator。我正在寻找图书馆,什么样本信号,像 Aquila 之类的东西。它需要MFCC技术。我将不胜感激所有的建议。接下来是麦克风。我完全不知道如何获得任何声音以处理设备。我的想法是,我按下按钮,麦克风将记录所有声音 5 秒钟,然后从中获取 MFCC。
【问题讨论】:
我正在 android 上编写应用程序,为此我正在使用 Qt creator。我正在寻找图书馆,什么样本信号,像 Aquila 之类的东西。它需要MFCC技术。我将不胜感激所有的建议。接下来是麦克风。我完全不知道如何获得任何声音以处理设备。我的想法是,我按下按钮,麦克风将记录所有声音 5 秒钟,然后从中获取 MFCC。
【问题讨论】:
要在 Qt 中记录数据,您可以使用 QAudioRecorder 并处理事件 bufferReady 以获取缓冲区数据。您可以在我的 github 中找到一个简单的示例:
https://github.com/mohabouje/logospeech-studio/blob/master/capturedata/recorder.h
如果您正在寻找一些库来估计 MFCC,请参阅此堆栈问题:Mel Frequency Cepstral Coefficients (MFCC) in C/C++
我会建议使用基本的 FFT 库来实现我们自己的算法,FFTW 对我来说是最好的,简单快捷。
如果您正在寻找一套完整的音频信号处理,我会推荐Essentia Lib
【讨论】: