【问题标题】:Continuously speech recognition连续语音识别
【发布时间】:2023-04-06 02:14:01
【问题描述】:

我目前正在做一个项目,我需要创建一些功能,让用户可以与产品 (Raspberry Pi 3) 交谈。至于说话,我的意思是用户应该能够对 Pi 说一两个词,例如 “product start”,然后它就会被激活并做这件事。

因此,Pi 需要能够在用户说出特定单词组合时持续聆听并激活。

我已经实现了SpeechRecognition 库,这种方法可以工作,但遗憾的是,树莓派最多只能听 10 秒。

我想知道是否有任何库可以帮助我解决我的用例,欢迎任何帮助。

【问题讨论】:

    标签: python speech-recognition google-speech-api


    【解决方案1】:

    你能更好地解释一下你的意思是什么

    遗憾的是,树莓派最多只能听 10 秒。

    根据我使用 CMUSphinx 的经验(让我为您的用例推荐 pocketsphinx 版本),可以毫无问题地持续工作。 您是否设法知道问题出在 Pi 端还是 SpeechRecognition 端?

    您在 SpeehRecognition 后面使用什么引擎。 CMUSphinx、谷歌、微软?对于 Google 和 Microsoft,它们有 10 秒的限制是正常的。但是,使用 CMUSphinx 不应该发生这种情况。但是,您可能需要学习一点如何设置 ASR 系统。

    【讨论】:

    • 感谢您的回复。大约 10 秒我提到,从我执行 Python 脚本的那一刻起,我的 Raspberry Pi 将监听大约 10 秒。现在这不是 Pi 本身的问题,这是在 SpeechRecognition 方面,我发现 10 秒是它可以识别的最大值。现在你提到了Pocketsphinx,我读了一些关于它的东西,但我没有它能够连续收听。你知道它是否能够直接从麦克风识别吗?还是它只能从 WAV 文件中识别。另外,您是否有任何关于 Pocketsphinx 的好教程?
    猜你喜欢
    • 2011-03-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-12-29
    相关资源
    最近更新 更多