【问题标题】:Preprocessing audio in android Speech Input recognizer在android语音输入识别器中预处理音频
【发布时间】:2012-05-21 07:00:27
【问题描述】:

我正在做一些基本的命令识别并为此使用 Google Search Input API。但是我想自己捕获音频,预处理音频(去噪,提升幅度等),将这些修改后的音频发送到识别器并获得结果。有可能吗?

我知道您可以使用SpeechRecognizerRecognitionListener 来使用onBufferReceived 方法获取音频。但是我想做预处理而不是后处理。是否有任何解决方法/黑客向谷歌识别器提供处理过的数据?

【问题讨论】:

    标签: android speech-recognition audio-processing


    【解决方案1】:

    预处理音频(去噪、提升幅度等),将修改后的音频发送到识别器并获取结果

    通常语音识别系统会遇到这种情况。不正确实施的去噪会降低语音识别的准确性,因为它会以不可预测的方式破坏频谱。幅度提升没有帮助,因为幅度在语音识别的一开始就被归一化。您的预处理只会造成伤害。

    如果你还想试试,试试pocketsphinx

    http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/

    【讨论】:

    • 感谢有关去噪陷阱的提示。我已经测试了 sphinx,但它在提供的应用程序上的效果非常差,这就是我想使用谷歌识别器的原因。逆向工程 android 识别器活动是进行预处理的唯一方法吗?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2012-01-24
    • 1970-01-01
    • 2011-07-09
    • 1970-01-01
    • 2010-12-02
    • 1970-01-01
    相关资源
    最近更新 更多