浏览器中的离线语音识别答案

【问题标题】：Offline Speech Recognition in browser浏览器中的离线语音识别
【发布时间】：2018-03-25 07:06:48
【问题描述】：

我正在开发一种需要从用户那里获取输入并基于它执行某些操作的产品。我们已经通过打字用聊天框实现了它，它正在服务于我们的目的。对于未来的版本，我们希望将语音识别添加到聊天窗口。我们想到了使用

window.speechRecognition() || window.webkitSpeechRecognition()

但我们了解到，浏览器中可用的功能使用 Google 的 Cloud Speech API。当我们处理非常敏感的用户信息时，这将是安全问题。是否有其他替代方法可以实现可在任何浏览器中运行的语音识别。

【问题讨论】：

【解决方案1】：

你可以试试：

【讨论】：

【解决方案2】：

使用 tensorflowjs "tfjs" 模型是在浏览器中工作的最明智的解决方案

语音命令识别器语音命令识别器是一个能够识别语音命令的 JavaScript 模块由小词汇表中简单孤立的英语单词组成

【讨论】：

【解决方案3】：

显然PocketSphinx.js 是目前唯一可用的方法。它是一个开源的语音到文本引擎，支持英语，但除此之外的语言不多。

Github：

但是，如果您想在单个 Android 设备实例（例如显示在公共区域某处的设备）上运行代码，您可以在移动 Chrome 的设置中使用“下载离线语音识别语言”。桌面浏览器没有这样的选项。

【讨论】：

【解决方案4】：

您可以尝试 IBM Watson 的 Speech To Text 服务。它可以在任何浏览器中使用，您可以选择退出，这样用户的数据就不会记录在服务器端：https://console.bluemix.net/docs/services/watson/getting-started-logging.html#controlling-request-logging-for-watson-services

它至少在 Firefox 和 Chrome 中工作，它基于以下开源 SDK：https://github.com/watson-developer-cloud/speech-javascript-sdk

ps。对于一般情况，当用户的数据不敏感时，最好不要选择退出，以便 Watson 可以利用这些数据来提高服务质量。

【讨论】：