【问题标题】:Poor recognition accuracy of Pocketsphinx using phoneme recognition on Android, French languagePocketsphinx在Android、法语上使用音素识别的识别精度差
【发布时间】:2026-01-06 00:35:01
【问题描述】:

我正在做一个项目,我必须将 Pocketsphinx 的语音功能集成到一个 android 应用程序中。事实上,我必须集成Pocketpshinx提供的音素识别功能,它应该能够识别法语的音素,例如语音识别器应该能够识别音节(如“de”、“re”、“se”等)、辅音(如“m”、“f”、“g”等)、双辅音(如“ kl”、“ks”、“gr”等)和元音(如“a”、“o”、“e”等)。 现在,我已经集成了用于识别上述音素的 Pocketsphinx,但我的结果非常糟糕。例如,当我发音“o”时,识别结果有时是:“SIL ff ei au”(甚至我根本没有发音字母“f”和“e”),或者在开头出现其他内容那是不发音的。开头出现的字母并不总是相同的(有时我会得到“ll”、“uu”等)。但有时,我发音的字母出现在开头(例如,对于“a”,我得到“SIL aa SIL”),但这种情况很少发生。 那么,你们能否帮助并让我知道可能是什么问题以及解决此问题的任何建议?我是否需要仅使用我感兴趣的这些字母创建语言模型和字典(因为字母的数量是固定的)?或者,也许我需要做声学模型的适配,或者训练声学模型?

非常感谢您!

【问题讨论】:

    标签: android speech-recognition cmusphinx pocketsphinx phoneme


    【解决方案1】:

    在您的模型中找到 feat.params 并根据您的选择更改 -cmuinit 值,另外,将 "-kws_threshold" 的值更改为 1e-40f 用于消除误报。

    【讨论】:

    • 你能详细说明一下这些值吗?
    最近更新 更多