【问题标题】:iPhone App › Add voice recognition? [closed]iPhone 应用 › 添加语音识别? [关闭]
【发布时间】:2010-10-30 20:23:19
【问题描述】:

我想构建一个使用语音识别的应用。我见过像谷歌这样的大公司实现了这个功能,但我很好奇在初创阶段做这件事。有人调查过这个吗?是否有任何工具可供我们执行此操作?

【问题讨论】:

标签: iphone speech-recognition voice-recording speech-to-text


【解决方案1】:

OpenEars 看起来很有希望... http://www.politepix.com/openears/

基于袖珍狮身人面像。

【讨论】:

    【解决方案2】:

    如果你从维基百科开始,你会得到一个很好的列表引擎 (http://en.wikipedia.org/wiki/Speech_recognition#Commercial_software.2Fmiddleware)

    在我撰写本文时(2009 年 6 月 24 日),我认为这是两个可行的开源解决方案

    两者都在 iphone 应用程序中使用过,但对 iphone 友好的源并不现成。

    在我编辑这篇文章时(2009 年 7 月 8 日),我最近了解到 Loquendo (http://www.loquendo.com/en/) 具有适用于 iphone 的语音识别和语音合成 (ASR & TTS)。

    【讨论】:

    • @Rohrer,如果我们为语音识别添加任何外部引擎,Apple 会批准这个
    • @Shibin - 我从来没有听说过这样的应用程序被拒绝,我也不希望它们会被拒绝,但你的里程可能会有所不同。您始终可以四处搜索特定 sdk 的用户,并确保他们的应用程序实际上正在发布。这对于商业 SDK 来说尤其容易。
    【解决方案3】:

    最好的方法可能是:

    1. 在手机上录音
    2. 将录音发送到运行语音识别软件的服务器
    3. 然后给手机返回一些东西来指示它应该做什么

    【讨论】:

    • 要发送的数据很多。我可能会在 iPhone 上尝试一下。毕竟,10 年前 PC 可以做到这一点,所以 iPhone 现在应该可以做到。
    • 这实际上是 Google 搜索应用使用的技术
    • Google 以一种特殊的方式对语音进行编码,他们不只是按照 Nosredna 给出的原因发送原始音频数据。
    • 没有什么可以阻止第 2 步包含压缩。
    【解决方案4】:

    Nuance 的 Dragon Mobile SDK 可以满足您的要求。您需要互联网连接才能将音频发送到 Nuance 的服务器,并获得文本响应列表。然后,您可以决定如何处理文本响应(例如,要求您的用户选择他的意思或执行某些操作)。这是链接:

    http://dragonmobile.nuancemobiledeveloper.com/

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-12-09
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-03-03
      相关资源
      最近更新 更多