【问题标题】:Has Anyone Successfully Used CMU Sphinx for Programming by Voice Recognition有没有人成功使用 CMU Sphinx 进行语音识别编程
【发布时间】:2023-10-03 17:29:01
【问题描述】:

我想开始通过语音识别软件进行一些编码(可能是我所做工作的 10-20%)。

我看到有些人使用 Dragon Natural Speech (DNS) 软件取得了成功,但我使用的是 Mac,不幸的是,Dragon 只能在 Windows 上运行。

有人使用 Carnegie Melon 开源 Sphinx http://cmusphinx.sourceforge.net/ 进行编程吗?

还有其他可以在 Mac 上实现的选项吗?我不介意投入一点现金来实现这一点。理想情况下,这将是一个我可以添加自己的命令的系统。 (看看这家伙用 DNS 做了什么很棒的事情:https://www.youtube.com/watch?v=8SkdfdXWYaI

【问题讨论】:

  • 答案是肯定的,甚至还有点乱七八糟的project about that on sourceforge。如果通过扬声器适配正确完成,CMUSphinx 可以非常准确和有用。但是 * 可能不是讨论这种开放式问题的最佳场所。

标签: workflow speech-recognition voice-recognition


【解决方案1】:

如果您不习惯使用 Sphinx,我会推荐 Kaldi 作为适应性强、兼容的开源语音识别器。使用 kaldi,您可以调整自己的语法和命令并重新训练底层模型。另外,还有一个python-wrapper,让Kaldis使用起来简单方便。

【讨论】:

    【解决方案2】:

    JetBrains 开发人员为 IDEA 编写了一个 protoype 插件。这项工作是在他们的一次黑客马拉松期间完成的。

    【讨论】:

      最近更新 更多