【发布时间】:2017-01-30 19:39:41
【问题描述】:
为了将语音转换为文本,我使用 cmusphinx 开源 API 将 .wav 音频格式转换为文本并使用特定输入语音语言的语言模型
【问题讨论】:
标签: api speech-recognition speech-to-text cmusphinx pocketsphinx
为了将语音转换为文本,我使用 cmusphinx 开源 API 将 .wav 音频格式转换为文本并使用特定输入语音语言的语言模型
【问题讨论】:
标签: api speech-recognition speech-to-text cmusphinx pocketsphinx
Pocket Sphinx 的准确性完全取决于所使用的模型。为了获得更好的结果,请尝试根据目标用户训练您的声学模型。
如果您不想训练自己的模型,请尝试更改 feat.params 的各种参数,例如 -cmninit。
另外,尽量将recognizer.setKeywordThreshold()设置为最小,我更喜欢recognizer.setKeywordThreshold(1e-40f)
【讨论】: