在android语音输入识别器中预处理音频

【问题标题】：Preprocessing audio in android Speech Input recognizer在android语音输入识别器中预处理音频
【发布时间】：2012-05-21 07:00:27
【问题描述】：

我正在做一些基本的命令识别并为此使用 Google Search Input API。但是我想自己捕获音频，预处理音频（去噪，提升幅度等），将这些修改后的音频发送到识别器并获得结果。有可能吗？

我知道您可以使用SpeechRecognizer 和RecognitionListener 来使用onBufferReceived 方法获取音频。但是我想做预处理而不是后处理。是否有任何解决方法/黑客向谷歌识别器提供处理过的数据？

【问题讨论】：

【解决方案1】：

预处理音频（去噪、提升幅度等），将修改后的音频发送到识别器并获取结果

通常语音识别系统会遇到这种情况。不正确实施的去噪会降低语音识别的准确性，因为它会以不可预测的方式破坏频谱。幅度提升没有帮助，因为幅度在语音识别的一开始就被归一化。您的预处理只会造成伤害。

如果你还想试试，试试pocketsphinx

【讨论】：

感谢有关去噪陷阱的提示。我已经测试了 sphinx，但它在提供的应用程序上的效果非常差，这就是我想使用谷歌识别器的原因。逆向工程 android 识别器活动是进行预处理的唯一方法吗？