【问题标题】:issue on creating language model for sinhala usin SRILM使用 SRILM 为僧伽罗语创建语言模型的问题
【发布时间】:2015-07-23 17:58:21
【问题描述】:

我正在尝试使用 pocketsphinx 创建一个僧伽罗语语音识别系统。我使用 SRILM 工具来创建语言模型。我创建语言模型的源文件是 Here 。我在 Windows 8.1 上使用 cygwin 来运行 SRILM 1.7.1。但是一旦我运行命令

ngram-count -vocab sinhalalexicon.txt -text sinhalacorpus.Train -order 3     -write sinhala.count -unk

我来了

iconv: Invalid or incomplete multibyte or wide character
iconv: Invalid or incomplete multibyte or wide character

我在这里做错了什么? sinhalacorpus.Train 文件是使用 Notepad++ 手动创建的

【问题讨论】:

    标签: voice-recognition pocketsphinx srilm


    【解决方案1】:

    我找到了解决问题的方法。一旦我将语料库和词典文件转换为 Unix 格式 并将编码更改为 UTF-8 without BOM 就可以了。我使用 Notepad++ 进行更改。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2016-03-03
      • 2013-07-08
      • 1970-01-01
      • 1970-01-01
      • 2013-10-11
      • 2020-01-28
      • 1970-01-01
      相关资源
      最近更新 更多