【问题标题】:Microsoft Speech Recognition defaults vs APIMicrosoft 语音识别默认值与 API
【发布时间】:2016-03-18 11:16:01
【问题描述】:

所以我一直在 Windows 10 中使用 Microsoft 语音识别,进行培训练习,将文本口述到写字板并进行更正,将单词添加到字典等等。我想使用该软件来转录 .wav 文件。似乎可以使用 Windows Speech Recognition API 来做到这一点,但这似乎涉及创建和加载自己的语法文件,这向我表明这基本上会创建一个新的语音识别器,它使用相同的构建块但不同当我在开始菜单中单击“开始语音识别”时运行的程序。特别是,由于训练或配置的差异,它的表现会有所不同。

我错了吗?如果我不是,是否还有一种方法可以检索默认语音识别器使用的所有数据,以便我可以准确地重现它的行为?如果我需要使用自己的语法文件和单独的训练历史等创建一个单独的语音识别器来转录 .wav 文件,那么就这样吧,但我想更好地了解这里发生了什么。

【问题讨论】:

  • 您是在谈论SpeechRecognizer 的不同Constraints 之间的区别吗?我不明白你想做什么,但是当你没有为你的“SpeechRecognizer”对象指定任何约束时,预定义的听写语法(SpeechRecognitionTopicConstrant)将被用作默认值。

标签: windows-10 speech-recognition microsoft-speech-platform microsoft-speech-api


【解决方案1】:

Woundify 开源项目包含如何将 wav 文件转换为文本 (STT) 的示例。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2023-04-05
    • 2023-03-12
    • 2023-04-08
    • 1970-01-01
    • 2020-07-09
    • 1970-01-01
    • 2018-11-27
    相关资源
    最近更新 更多