【发布时间】:2025-12-20 01:50:16
【问题描述】:
所以 Vosk-api 是一款出色的离线语音识别器,具有出色的支持,但在本文发布时(2020 年 8 月 14 日)文档非常差(或巧妙地隐藏)
问题是:是否有任何替代 google-speech-recognizer 功能,可以通过语音适应来进一步改进转录?
例如
"config": {
"encoding":"LINEAR16",
"sampleRateHertz": 8000,
"languageCode":"en-US",
"speechContexts": [{
"phrases": ["weather"]
}]
}
对于 Google,此配置意味着短语 weather 将具有更高的优先级,例如,是否听起来相同。
还是类令牌? 我知道它可能不会在 Vosk for python3 中实现,但仍然......
以下是参考资料:
https://cloud.google.com/speech-to-text/docs/class-tokens
https://cloud.google.com/speech-to-text/docs/speech-adaptation
【问题讨论】:
-
Guillermo Ruiz Camauer 发布了一个 Answer 说“您可以向 Vosk 发送短语列表中的预期单词列表。请参见此处的示例:https://github.com/alphacep/vosk-server/blob/master/websocket/test_words.py”
标签: python-3.x google-speech-to-text-api vosk