【发布时间】:2011-12-07 01:06:13
【问题描述】:
我正在探索SpeechRecognitionEngine 的功能,我的最终目标是输入一个 WAV 文件和该 WAV 文件的转录,并输出 WAV 文件中开头(理想情况下是结尾)的位置每个单词。
我可以让引擎成功识别短语,但我无法理解如何在单词开始时检索音频位置,而不是在识别假设或识别时等。
如果您好奇这是什么意思,那就是自动化口型同步动画工作流程。
感谢您的宝贵时间。
【问题讨论】:
-
您能否请教一下您是如何让引擎识别该短语的?我正在尝试做类似的事情,并且几乎被卡住了。提前感谢您的帮助:)
-
我使用了一个
GrammarBuilder,它是从一个包含我想识别的单词的字符串数组创建的,以创建一个Grammar对象,我使用LoadGrammar方法将其加载到SpeechRecognitionEngine中。跨度>
标签: c# speech-recognition