【发布时间】:2015-10-08 21:44:15
【问题描述】:
我有一个非常具体的要求。我正在开发一个应用程序,它允许用户在应用程序中说出他们的员工编号,其格式为 HN56C12345(任何字母数字字符序列)。我已经浏览了链接:http://cmusphinx.sourceforge.net/wiki/tutoriallm,但我不确定这是否适用于我的用例。
所以我的问题是三方面的:
- Sphinx4 能否以高精度识别字母数字序列,例如我的 emp 数字?
- 如果是,谁能给我指出一个具体的示例/参考页面,其中有人从头开始在 Sphinx4 中构建了自定义语言支持。我还没有找到详细的分步文档。有人研究过基于字母数字序列的字典或语言模型吗?
- 如何为此场景构建声学模型?
【问题讨论】:
标签: cmusphinx sphinx4 language-model