【发布时间】:2021-05-10 14:07:59
【问题描述】:
我想创建一个网络应用程序(Flask-A Flashcard AI),其中一部分是一个机器人,需要通过语音识别和文本到语音直接与人类交互。我为此安装了 pyttsx3 和 speech_recognition,我很困惑的是我应该如何获取用户的音频作为输入,然后将其发送到后端。我尝试查找 YouTube 教程并询问其他人,我唯一的成功是了解 Navigator.MediaDevices.getUserMedia。我想让通信流畅,我还必须将数据发送到后端。我不知道如何将它发送到后端并流畅地获取用户媒体,我可以使用Navigator.MediaDevices.getUserMedia 并将其转换为音频文件(不知道如何做到这一点,但我想我会弄明白的最终,让用户上传录音并不是一件好事),但这会占用数据库的大量空间。 p>
【问题讨论】:
标签: python flask getusermedia