将麦克风输入流式传输到 Google Speech API答案

【问题标题】：Streaming microphone input to Google Speech API将麦克风输入流式传输到 Google Speech API
【发布时间】：2017-03-28 09:35:39
【问题描述】：

我研究了 Google Cloud Speech API，并让我的麦克风在 Node 服务器上工作。

然后我想知道从网络前端流式传输麦克风的最佳做法是什么？它是否将音频流从 getUserMedia 发送到 Node 服务器并使用 Node API 客户端将其通过管道传输到 API？还是只是将语音输入保存到我然后传输到 API 的文件中？

目的是“转录”指令（一两句话长）并将结果发送到另一个 API。

【问题讨论】：

您可以直接从 getUserMedia 向 API 传输数据，无需保存到文件，也无需中间节点服务器。
感谢您的回答！一个人会怎么做呢？据我了解，REST API 不支持流 (?)
类似npmjs.com/package/grpc-web-client
查看该软件包的 git 存储库，它看起来不支持流式传输； “值得注意的是，gRPC-Web 规范目前不支持客户端流。”。 (github.com/improbable-eng/grpc-web)
我也想这样做，但现在卡住了。我尝试过使用 socket.io，但不知道如何将浏览器中的缓冲音频转换为可管道流以发送到 Google Speech API。我遇到的另一个选择是使用 binary.js，它似乎工作得更好，但我最终在服务器上得到了一个“BinaryStream”对象，我不知道该怎么处理。有没有人成功使用过这两种方法？

【解决方案1】：

我知道这个问题已经有一年多了，OP 可能已经找到答案或放弃了，但我花了足够长的时间徒劳地尝试在谷歌上搜索这个问题，然后才发现我想帮助任何关注的人在我的脚步中：我为基本上这种确切的情况写了一个教程here。

【讨论】：