演讲者语音的 Python Speech-to-Text 翻译答案

【问题标题】：Python Speech-to-Text translation for Speaker voice演讲者语音的 Python Speech-to-Text 翻译
【发布时间】：2021-07-27 23:33:57
【问题描述】：

我担心有什么方法可以为说话者的声音进行语音到文本的翻译。

场景：

当我通过 Teams 或 Skype 为通话双方用户通话时将语音（语音）运行时翻译成文本。

我尝试过使用 Google Api 和 Microsoft Api，但在这两种情况下，它都只为一侧语音进行翻译，而不是为通话中的另一侧语音进行翻译。我尝试使用speech_recognition python 包中的Microphone() 函数，但是没有运气。

我在互联网上到处搜索，但都是通过麦克风和录制的音频文件（.wav）给出语音识别（语音到文本翻译）的例子。通过录制的文件，我可以做到这一点，但是，当我通过 Teams 或 Skype 通话时，我想进行实时翻译。

如果有人对此有任何了解，请分享。提前致谢。

注意：如果你愿意，我可以重新解释一下。

【问题讨论】：

标签： python-3.x speech-recognition speech-to-text

【解决方案1】：

import speech_recognition as sr

for index, name in enumerate(sr.Microphone.list_microphone_names()):
    print("Microphone with name \"{1}\" found for `Microphone(device_index {0})`".format(index, name))

【讨论】：

欢迎来到 StackOverflow！请解释这段代码的工作原理以及它如何帮助解决相关问题。