【发布时间】:2017-03-28 09:35:39
【问题描述】:
我研究了 Google Cloud Speech API,并让我的麦克风在 Node 服务器上工作。
然后我想知道从网络前端流式传输麦克风的最佳做法是什么?它是否将音频流从 getUserMedia 发送到 Node 服务器并使用 Node API 客户端将其通过管道传输到 API?还是只是将语音输入保存到我然后传输到 API 的文件中?
目的是“转录”指令(一两句话长)并将结果发送到另一个 API。
【问题讨论】:
-
您可以直接从 getUserMedia 向 API 传输数据,无需保存到文件,也无需中间节点服务器。
-
感谢您的回答!一个人会怎么做呢?据我了解,REST API 不支持流 (?)
-
查看该软件包的 git 存储库,它看起来不支持流式传输; “值得注意的是,gRPC-Web 规范目前不支持客户端流。”。 (github.com/improbable-eng/grpc-web)
-
我也想这样做,但现在卡住了。我尝试过使用 socket.io,但不知道如何将浏览器中的缓冲音频转换为可管道流以发送到 Google Speech API。我遇到的另一个选择是使用 binary.js,它似乎工作得更好,但我最终在服务器上得到了一个“BinaryStream”对象,我不知道该怎么处理。有没有人成功使用过这两种方法?
标签: node.js stream speech google-cloud-speech