【问题标题】:Different between Google Speech API and Web Speech APIGoogle Speech API 和 Web Speech API 的区别
【发布时间】:2015-12-07 15:39:56
【问题描述】:
我正在研究网络语音识别。
我发现谷歌提供了一个 API 调用“谷歌语音 API V2”给开发者。但是我注意到每天使用它是有限制的。
后来我发现有一个原生的WEB Speech API也可以实现语音识别。它只适用于谷歌浏览器和歌剧:
http://caniuse.com/#feat=speech-recognition
所以
1. Google Speech API 和 Web Speech API 有什么不同?他们有什么关系吗?
- 语音识别结果json是google返回的。谷歌语音api会比网络语音api更准确吗?
谢谢。
【问题讨论】:
标签:
webspeech-api
google-speech-api
【解决方案1】:
Web Speech API 是 W3C 支持的规范,它允许浏览器供应商提供他们选择的语音识别引擎(无论是本地的还是基于云的),它支持您可以直接从浏览器使用而无需担心的 API API 限制等。你可以想象,Apple 可能会通过 Siri 来实现这一点,而微软可能会通过 Cortana 来实现。同样,浏览器供应商可以选择在操作系统中使用内置的听写软件,但这似乎不是目前的趋势。如果您尝试在浏览器中执行简单的语音合成(例如语音命令),这可能是最佳途径,尤其是随着采用率的增长。
Google Speech API 是一种基于云的解决方案,可让您在浏览器之外使用 Google 的语音软件。它还提供更广泛的语言支持,并且可以转录更长的音频文件。如果您有 20 分钟的录音要转录,这将是您的选择。截至撰写本文时,Google 对这项服务的第一个小时后记录的每 15 秒收费 0.006 美元。
【讨论】:
-
您是否熟悉使用 Web Speech API 的实时网络服务器上的问题? Web Speech API 在本地工作,但在部署到 AWS EC2 后,我收到错误 speechSynthesis: error “not allowed”。我在这里详细说明了我的问题:*.com/questions/45891229/…
【解决方案2】:
Web API 是基于 REST 的 API,具有 API 密钥身份验证,尤其适用于需要简单功能集的网页。
虽然 Google Speech API 基本上是一个具有各种身份验证方法的 gRPC API。使用 gRPC 时有很多功能可用,例如身份验证、更快的调用和流式传输!!!