【发布时间】:2010-05-06 02:43:59
【问题描述】:
我想使用 sphinx4 或 HTK 工具包为我构建一个语音识别应用程序,旨在通过语音估计一个人的年龄。我在更大程度上了解语音识别所涉及的统计模型。 我对梅尔频率倒谱系数和高斯混合模型感兴趣,因为这两个更适合我的问题域。我是否必须使用神经网络并从 sphinx 分类器派生的向量中输入训练数据?我不太确定从哪里开始使用 sphinx 或 HTK 工具包。 我是 sphinx 和语音识别的新手,我的应用程序只是一个原型。
任何人都可以在这方面提供某种形式的指导。 亲切的问候。
【问题讨论】:
标签: sphinx4