【发布时间】:2018-11-08 00:11:27
【问题描述】:
我有一个 PHP Web 应用程序,我正在寻找一个开源的、高精度的语音到文本识别实现,该实现将接受语音命令来打开用户的网页。示例:“进行销售”(这将打开创建销售 PHP 页面)、“进行采购订单”、“打开 END-OF-DAY 报告”等。
我的问题:
我想知道我们是否可以使用 Mozilla DeepSpeech 从 Firefox 浏览器获取 .wav 音频并将语音转换为文本。如果是,那么使用麦克风从 Firefox 录制语音到使用 DeepSpeech 引擎转换文本的流程是什么?
如何进行类似于 OK-GOOGLE 的唤醒/启动调用,准备好监听命令?
【问题讨论】:
-
我已经尝试过,但找不到任何合适的 API。
-
似乎应该是可能的,但我肯定没有实施指南。看起来您只是想了解事物的结构应该如何才能使其工作——这绝对是一个有趣的问题。上周我只是查看了这个我正在使用 CI 进行的家庭自动化项目,并且正试图围绕它来解决这个问题。
标签: php speech-recognition speech-to-text webspeech-api mozilla-deepspeech