【问题标题】:getting started with speech recognition and speech synthesis语音识别和语音合成入门
【发布时间】:2010-10-07 11:09:24
【问题描述】:

我想开始使用语音识别和语音合成 在Prototype based on speech recognition 有人告诉我使用微软语音服务器(sdk 等)

当我有这个时,我如何对应用程序进行编程,以及使用哪种编程语言(开发环境?)?

有人使用过星号或 SVOX 吗?

我需要做的:

语音识别 语音合成

我不必是一个非常好的语音识别 - 我认为 30 -50 个单词应该足够开始了。 我正在使用 Windows。

提前致谢

【问题讨论】:

    标签: speech-recognition speech speech-synthesis


    【解决方案1】:

    如果您选择使用 Microsoft Speech Engine,则可以使用 .NET 框架 API。正如我在另一篇文章中提到的,有两个命名空间(System.Speech 用于桌面,Microsoft.Speech 用于服务器)。您可以使用任何 .NET 语言进行编程,也可以使用 Visual Studio。

    几年前在http://msdn.microsoft.com/en-us/magazine/cc163663.aspx 发表了一篇非常好的文章。这可能是迄今为止我找到的最好的介绍性文章。但是,它基于 WinFX API 的预发布版本,并且在 Vista 发布时更改了 System.Speech 类。由于这些破坏性的 API 更改,本文中的示例无法编译,我没有找到任何更新或勘误表来解释这一点。在互联网上搜索方法名称“AppendResultKeyValue”,您会发现一些论坛帖子,例如http://www.ms-news.net/f3012/system-speech-breaking-changes-3025734.html,人们遇到了同样的问题。

    这仍然是一篇很好的介绍性文章,值得一读。稍加修改,您就可以让示例应用正常运行。

    【讨论】:

    【解决方案2】:

    当我学习计算语言学时,我选择的工具是Praat,这是一个非常混乱的原型设计工具,可以让你做任何与语音相关的事情。

    我不认为它有任何外部 API,但它的内部脚本语言对于初级应用程序来说已经足够了,而且它有很多内置函数。对于理论和算法的“入门”来说,还不错。

    【讨论】:

      猜你喜欢
      • 2012-08-27
      • 2021-04-26
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2023-03-03
      • 1970-01-01
      • 2011-11-01
      相关资源
      最近更新 更多