【发布时间】:2021-07-27 23:33:57
【问题描述】:
我担心有什么方法可以为说话者的声音进行语音到文本的翻译。
场景:
当我通过 Teams 或 Skype 为通话双方用户通话时将语音(语音)运行时翻译成文本。
我尝试过使用 Google Api 和 Microsoft Api,但在这两种情况下,它都只为一侧语音进行翻译,而不是为通话中的另一侧语音进行翻译。我尝试使用speech_recognition python 包中的Microphone() 函数,但是没有运气。
我在互联网上到处搜索,但都是通过麦克风和录制的音频文件(.wav)给出语音识别(语音到文本翻译)的例子。通过录制的文件,我可以做到这一点,但是,当我通过 Teams 或 Skype 通话时,我想进行实时翻译。
如果有人对此有任何了解,请分享。 提前致谢。
注意:如果你愿意,我可以重新解释一下。
【问题讨论】:
标签: python-3.x speech-recognition speech-to-text