【问题标题】:Web Speech API Custom WordsWeb Speech API 自定义词
【发布时间】:2013-09-16 14:25:03
【问题描述】:

我通读了W3C docs,我认为自定义单词来自自定义语法,但我尝试转到this demo,并在控制台中输入了以下javascript:

recognition.grammars.addFromString('foo');

运行良好,recognition.grammars[0].src 返回:"data:application/xml,foo"

注意:“foo”不是我感兴趣的词,但我感兴趣的词不是英文单词,以“foo”为例。当我正常说出我的自定义词时,它认为我在说别的东西(这是有道理的)。我在这里使用 'foo' 来保护我的品牌 :)

所以我想要的是能够像“Ok, Google”一样说“Hey, foo”。但是我的“foo”字不是一个实际的字,所以SpeechRecognitionResult 没有我的自定义字。

是我误解了如何添加自定义词,还是今天不可能?

【问题讨论】:

  • 你有没有发现什么东西可以让它成为可能?
  • @Nedudi 不,我什么也没找到。但我停止寻找,只是改变了我的要求。可能有什么东西在那里......

标签: javascript html speech-recognition w3c speech-to-text


【解决方案1】:

当我正常说出我的自定义词时,它认为我在说别的东西(这是有道理的)。

Google 在不支持语法的情况下提供非常有限的语音 API 实现,请参阅有关该问题的问题:

Grammar in Google speech API

此外,即使是原始规范在语法及其处理方面也不完整。

所以我想要的是能够说“嘿,foo”,类似于“Ok,Google”的工作方式。但我的“foo”字不是实际字,所以 SpeechRecognitionResult 没有我的自定义字。

此任务不是语音识别任务,因此无法通过语音识别引擎有效解决,它需要关键字定位,因为它需要过滤除您的关键字之外的所有语音。

您可以尝试使用 Pocketsphinx javascript 库 (http://cmusphinx.sourceforge.net/2013/06/voice-enable-your-website-with-cmusphinx/) 来实现这一点。使用 pocketsphinx,也可以更轻松地在那里调试发音问题。

另请参阅Web Speech API - SpeechGrammar,它专门描述了对语法的支持。

【讨论】:

  • 男孩,这是一个相当复杂的库。它看起来既不完善,也不易于使用。但感谢您的链接。你得到了答案。
  • 我尝试了演示,并没有留下深刻的印象。 5 年后,我们将回顾这一点,并嘲笑我们的语音识别是多么初级。
  • 2018年还是这样吗?
猜你喜欢
  • 2020-01-12
  • 1970-01-01
  • 2023-01-05
  • 1970-01-01
  • 1970-01-01
  • 2015-12-07
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多