连续语音识别答案

【问题标题】：Continuously speech recognition连续语音识别
【发布时间】：2023-04-06 02:14:01
【问题描述】：

我目前正在做一个项目，我需要创建一些功能，让用户可以与产品 (Raspberry Pi 3) 交谈。至于说话，我的意思是用户应该能够对 Pi 说一两个词，例如 “product start”，然后它就会被激活并做这件事。

因此，Pi 需要能够在用户说出特定单词组合时持续聆听并激活。

我已经实现了SpeechRecognition 库，这种方法可以工作，但遗憾的是，树莓派最多只能听 10 秒。

我想知道是否有任何库可以帮助我解决我的用例，欢迎任何帮助。

【问题讨论】：

【解决方案1】：

你能更好地解释一下你的意思是什么

遗憾的是，树莓派最多只能听 10 秒。

根据我使用 CMUSphinx 的经验（让我为您的用例推荐 pocketsphinx 版本），可以毫无问题地持续工作。您是否设法知道问题出在 Pi 端还是 SpeechRecognition 端？

您在 SpeehRecognition 后面使用什么引擎。 CMUSphinx、谷歌、微软？对于 Google 和 Microsoft，它们有 10 秒的限制是正常的。但是，使用 CMUSphinx 不应该发生这种情况。但是，您可能需要学习一点如何设置 ASR 系统。

【讨论】：

感谢您的回复。大约 10 秒我提到，从我执行 Python 脚本的那一刻起，我的 Raspberry Pi 将监听大约 10 秒。现在这不是 Pi 本身的问题，这是在 SpeechRecognition 方面，我发现 10 秒是它可以识别的最大值。现在你提到了Pocketsphinx，我读了一些关于它的东西，但我没有它能够连续收听。你知道它是否能够直接从麦克风识别吗？还是它只能从 WAV 文件中识别。另外，您是否有任何关于 Pocketsphinx 的好教程？