【问题标题】:Is there any way to fluently receive audio and send it to the backend有什么方法可以流畅地接收音频并将其发送到后端
【发布时间】:2021-05-10 14:07:59
【问题描述】:

我想创建一个网络应用程序(Flask-A Flashcard AI),其中一部分是一个机器人,需要通过语音识别和文本到语音直接与人类交互。我为此安装了 pyttsx3 和 speech_recognition,我很困惑的是我应该如何获取用户的音频作为输入,然后将其发送到后端。我尝试查找 YouTube 教程并询问其他人,我唯一的成功是了解 Navigator.MediaDevices.getUserMedia。我想让通信流畅,我还必须将数据发送到后端。我不知道如何将它发送到后端并流畅地获取用户媒体,我可以使用Navigator.MediaDevices.getUserMedia 并将其转换为音频文件(不知道如何做到这一点,但我想我会弄明白的最终,让用户上传录音并不是一件好事),但这会占用数据库的大量空间。 p>

【问题讨论】:

    标签: python flask getusermedia


    【解决方案1】:

    如果您只想处理一些基于语音的动作,您可以使用语音 API。 https://developer.mozilla.org/en-US/docs/Web/API/Web_Speech_API

    此 API 将能够为您提供基于文本的字幕,您可以轻松地将其存储在数据库中。

    如果您需要将音频存储在服务器端,您可以将其转换为诸如mp3aac 之类的低级格式以节省空间。

    【讨论】:

      猜你喜欢
      • 2021-10-16
      • 1970-01-01
      • 1970-01-01
      • 2021-11-26
      • 1970-01-01
      • 1970-01-01
      • 2014-04-23
      • 1970-01-01
      • 2021-12-06
      相关资源
      最近更新 更多