【发布时间】:2017-10-14 17:53:15
【问题描述】:
我开始探索 Google Cloud Speech API。
我已经看过了
“语音 API 支持任何可以发送 REST 请求的设备”
因此,我认为我可以从任何浏览器(在笔记本电脑和移动设备上)调用此类 API。具体来说,我对使用 API 将“语音”转换为文本的场景感兴趣。我正在弄清楚类似以下内容:
- 用户录制他/她的声音并将其流式传输到 API
- API 将其转换为发送回浏览器的文本
- 浏览器使用接收到的文本执行操作(例如,保存 后端数据库上的文本)
我进行了一些搜索,收集了一些信息,但在真正沿着这条道路前进之前,我有一些很大的疑问需要澄清
- 是否可以直接从 浏览器,即使用Javascript?质疑来自事实 文档显示nodejs examples 但不纯 javascript 的
- 能否使用 Safari(桌面和
在移动)?怀疑来自这样一个事实,即到目前为止我所做的所有搜索都指向我读到 Safari 不支持音频录制的页面(即
getUserMediaHTML5 API)
我们将不胜感激任何关于这些点的指导。
【问题讨论】:
-
你能让 ASR 在 Safari 上工作吗?我知道存在巨大的兼容性问题,但事实上 IBM Watson 和 Google Speech Cloud 都有适用于 Safari 谜题的演示,同时也给了我希望
标签: javascript safari google-cloud-platform mobile-safari google-speech-api