【问题标题】:Is it possible and advisable to call Google Cloud Speech APIs directly from browsers, including Safari?直接从浏览器(包括 Safari)调用 Google Cloud Speech API 是否可行且可取?
【发布时间】:2017-10-14 17:53:15
【问题描述】:

我开始探索 Google Cloud Speech API。

我已经看过了

“语音 API 支持任何可以发送 REST 请求的设备”

因此,我认为我可以从任何浏览器(在笔记本电脑和移动设备上)调用此类 API。具体来说,我对使用 API 将“语音”转换为文本的场景感兴趣。我正在弄清楚类似以下内容:

  1. 用户录制他/她的声音并将其流式传输到 API
  2. API 将其转换为发送回浏览器的文本
  3. 浏览器使用接收到的文本执行操作(例如,保存 后端数据库上的文本)

我进行了一些搜索,收集了一些信息,但在真正沿着这条道路前进之前,我有一些很大的疑问需要澄清

  1. 是否可以直接从 浏览器,即使用Javascript?质疑来自事实 文档显示nodejs examples 但不纯 javascript 的
  2. 能否使用 Safari(桌面和 在移动)?怀疑来自这样一个事实,即到目前为止我所做的所有搜索都指向我读到 Safari 不支持音频录制的页面(即 getUserMediaHTML5 API)

我们将不胜感激任何关于这些点的指导。

【问题讨论】:

  • 你能让 ASR 在 Safari 上工作吗?我知道存在巨大的兼容性问题,但事实上 IBM Watson 和 Google Speech Cloud 都有适用于 Safari 谜题的演示,同时也给了我希望

标签: javascript safari google-cloud-platform mobile-safari google-speech-api


【解决方案1】:

从 iOS11 开始,Apple 增加了对 getUserMedia API 的支持。

您可以了解更多here

更新 流式语音识别是流式音频的潜在解决方案 (https://cloud.google.com/speech/docs/streaming-recognize)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-07-26
    • 1970-01-01
    • 1970-01-01
    • 2020-01-22
    • 2016-11-17
    • 1970-01-01
    • 2020-11-20
    • 1970-01-01
    相关资源
    最近更新 更多