【发布时间】:2017-05-19 06:19:13
【问题描述】:
我正在开发一个用于实时翻译的 Python 应用程序。我需要实时识别语音:当用户说话时,它会自动将这段音频发送到 Google Speech API 并返回一个文本。所以我希望识别的文本在说话时立即出现。
我找到了 Streaming Speech Recognition,但似乎我仍然需要先录制完整的语音,然后将其发送到服务器。另外,没有关于如何在 Python 中使用它的示例
是否可以使用 Google Speech API 做到这一点?
【问题讨论】: