直接从浏览器（包括 Safari）调用 Google Cloud Speech API 是否可行且可取？答案

【问题标题】：Is it possible and advisable to call Google Cloud Speech APIs directly from browsers, including Safari?直接从浏览器（包括 Safari）调用 Google Cloud Speech API 是否可行且可取？
【发布时间】：2017-10-14 17:53:15
【问题描述】：

我开始探索 Google Cloud Speech API。

我已经看过了

“语音 API 支持任何可以发送 REST 请求的设备”

因此，我认为我可以从任何浏览器（在笔记本电脑和移动设备上）调用此类 API。具体来说，我对使用 API 将“语音”转换为文本的场景感兴趣。我正在弄清楚类似以下内容：

用户录制他/她的声音并将其流式传输到 API
API 将其转换为发送回浏览器的文本
浏览器使用接收到的文本执行操作（例如，保存后端数据库上的文本）

我进行了一些搜索，收集了一些信息，但在真正沿着这条道路前进之前，我有一些很大的疑问需要澄清

是否可以直接从浏览器，即使用Javascript？质疑来自事实文档显示nodejs examples 但不纯 javascript 的
能否使用 Safari（桌面和在移动）？怀疑来自这样一个事实，即到目前为止我所做的所有搜索都指向我读到 Safari 不支持音频录制的页面（即 getUserMediaHTML5 API)

我们将不胜感激任何关于这些点的指导。

【问题讨论】：

你能让 ASR 在 Safari 上工作吗？我知道存在巨大的兼容性问题，但事实上 IBM Watson 和 Google Speech Cloud 都有适用于 Safari 谜题的演示，同时也给了我希望

标签： javascript safari google-cloud-platform mobile-safari google-speech-api

【解决方案1】：

从 iOS11 开始，Apple 增加了对 getUserMedia API 的支持。

您可以了解更多here。

更新流式语音识别是流式音频的潜在解决方案 (https://cloud.google.com/speech/docs/streaming-recognize)

【讨论】：