语音识别和语音合成入门答案

【问题标题】：getting started with speech recognition and speech synthesis语音识别和语音合成入门
【发布时间】：2010-10-07 11:09:24
【问题描述】：

我想开始使用语音识别和语音合成在Prototype based on speech recognition 有人告诉我使用微软语音服务器（sdk 等）

当我有这个时，我如何对应用程序进行编程，以及使用哪种编程语言（开发环境？）？

有人使用过星号或 SVOX 吗？

我需要做的：

语音识别语音合成

我不必是一个非常好的语音识别 - 我认为 30 -50 个单词应该足够开始了。我正在使用 Windows。

提前致谢

【问题讨论】：

标签： speech-recognition speech speech-synthesis

【解决方案1】：

如果您选择使用 Microsoft Speech Engine，则可以使用 .NET 框架 API。正如我在另一篇文章中提到的，有两个命名空间（System.Speech 用于桌面，Microsoft.Speech 用于服务器）。您可以使用任何 .NET 语言进行编程，也可以使用 Visual Studio。

几年前在http://msdn.microsoft.com/en-us/magazine/cc163663.aspx 发表了一篇非常好的文章。这可能是迄今为止我找到的最好的介绍性文章。但是，它基于 WinFX API 的预发布版本，并且在 Vista 发布时更改了 System.Speech 类。由于这些破坏性的 API 更改，本文中的示例无法编译，我没有找到任何更新或勘误表来解释这一点。在互联网上搜索方法名称“AppendResultKeyValue”，您会发现一些论坛帖子，例如http://www.ms-news.net/f3012/system-speech-breaking-changes-3025734.html，人们遇到了同样的问题。

这仍然是一篇很好的介绍性文章，值得一读。稍加修改，您就可以让示例应用正常运行。

【讨论】：

查看stackoverflow.com/questions/3865351/…提到的其他帖子

【解决方案2】：

当我学习计算语言学时，我选择的工具是Praat，这是一个非常混乱的原型设计工具，可以让你做任何与语音相关的事情。

我不认为它有任何外部 API，但它的内部脚本语言对于初级应用程序来说已经足够了，而且它有很多内置函数。对于理论和算法的“入门”来说，还不错。

【讨论】：