【发布时间】:2010-10-28 11:10:41
【问题描述】:
我有一个语音应用程序,如果能够使用“触发词”开始录制音频,该应用程序将会大大改进。我不需要完整的语音文本引擎,只需要可靠/有效地检测触发词的能力。
我想知道是否有任何专门的语音引擎支持这个特定的用例,或者有任何库/方法来开发这种单一用途的检测引擎。理想情况下,我希望它能够在嘈杂的环境中工作,但它可以针对单个用户的声音进行训练。
研究论文/主题的指针也将不胜感激,所以我知道要问什么。
【问题讨论】:
-
必须是口语吗?拍手或吹口哨会容易得多。
-
如果你的项目是开源的,请分享链接,我正在做一个类似的项目
标签: speech-recognition signal-processing voice voice-recording