【问题标题】:Already trained HMM model for word recognition已经训练好的用于单词识别的 HMM 模型
【发布时间】:2016-04-09 16:01:04
【问题描述】:

我已经使用自动编码器实现了一个音素分类器(给定一个音频文件数组,它会返回所有已识别的音素)。我想扩展这个项目,以便可以识别单词。是否存在已经训练过的 HMM 模型(英文)可以识别给定音素列表的单词?

谢谢大家。

【问题讨论】:

    标签: python speech-recognition cmusphinx htk autoencoder


    【解决方案1】:

    我不知道有任何解码器可以帮助您。语音识别软件不能以这种方式工作。

    通常这样的事情需要自定义实现动态波束搜索。这不是一项艰巨的任务,可能只有 100 行代码。它还取决于您的语音解码器产生的内容。是语音格子(理想情况下),还是有分数的 1-best 结果,或者只是没有分数的 1-best 结果。

    如果您有合适的 lattice,您可能想尝试使用 openfst 工具包将 LM 和字典转换为 FST,然后使用 lattice FST 组合,然后使用 fstbestpath 找到最佳路径。不过,您可以简单地编写动态搜索来代替所有这些语音转换。

    百度在他们的项目中也将语音转换为字母,然后使用语言模型来修复字母序列。但他们说,没有语言模型,它也同样有效。

    【讨论】:

      猜你喜欢
      • 2018-01-14
      • 2018-11-20
      • 1970-01-01
      • 2023-04-09
      • 2019-09-25
      • 2019-10-30
      • 2011-06-02
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多