【问题标题】:Use German dictionary and language model with Sphinx4使用 Sphinx4 使用德语词典和语言模型
【发布时间】:2016-02-19 20:38:20
【问题描述】:

我可以使用 Sphinx4 自带的 en-us 东西,没问题:

cfg.setAcousticModelPath("resource:/edu/cmu/sphinx/models/en-us/en-us")
cfg.setDictionaryPath("resource:/edu/cmu/sphinx/models/en-us/cmudict-en-us.dict")
cfg.setLanguageModelPath("resource:/edu/cmu/sphinx/models/en-us/en-us.lm.bin")

我可以用它来转录英文录音。

现在我想将它与 德语 录音一起使用。在网站上,我找到了Acoustic and Language Models 的链接。其中有一个档案“German Voxforge”。它找到了 acoustic model 路径的相应文件。但据我所知,它不包含字典或语言模型。

如何在 Sphinx4 中获取德语的字典和语言模型路径?

【问题讨论】:

    标签: cmusphinx sphinx4


    【解决方案1】:

    您自己创建它们。您可以从字幕或维基百科转储创建语言模型。文档是here

    最新的德国模型实际上不在 CMUSphinx 页面上,它们位于github/gooofy。在这个愚蠢的项目中,您可以找到字典文档、模型和相关数学。

    【讨论】:

    • 对不起。澄清。从gooofy的下载中,我应该使用voxforge.dic(26K字,而en-us有134K)和voxforge.lm.DMP,对吧?
    • 是的,它们有效。文件结尾必须更改为小写 .dmp,因为 Sphinx4 只能识别小写扩展。
    【解决方案2】:

    我用 pocketsphinx 尝试了德国模型,但由于使用了“无效”语言模型 *.lm.bin 文件而出现了一些错误。 我已切换到 *.lm.gz 并且工作正常。

    正确的配置列表是:

    • fst = voxforge-de.fst
    • 嗯文件夹 = model_parameters/voxforge.cd_cont_6000
    • 字典 = cmusphinx-voxforge-de.dic
    • 语言模型 = cmusphinx-voxforge-de.lm.gz

    要获取“hmm”路径,您应该解压缩存档: cmusphinx-de-voxforge-5.2.tar.gz

    我认为 Sphinx4 应该也是一样的,所以请试一试。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2019-01-02
      • 1970-01-01
      • 2011-12-23
      • 2012-09-28
      • 2012-08-02
      • 1970-01-01
      • 2019-08-01
      • 1970-01-01
      相关资源
      最近更新 更多