【问题标题】:converting audio file into text file using java使用java将音频文件转换为文本文件
【发布时间】:2012-03-05 15:29:11
【问题描述】:

我正在使用 java 开发一个桌面应用程序。这个应用程序是给小学生教英语的,用户可以上传一些英语音频,可以是任何需要转换成文本文件的格式。他们可以在哪里阅读文本。

我找到了一些 api,但我不确定它们。

http://cmusphinx.sourceforge.net/wiki/

我在 stackoverflow 上看到了很多关于此的问题,但没有一个有用。如果有人能在这方面提供帮助将非常感激

谢谢

【问题讨论】:

  • 只是让您知道,您想要实现的目标并非微不足道 - 并且可能没有任何解决方案可以让您获得 100% 的转化率......相反(text2speech ) 更容易。您可能想查看执行此操作的 3rd-party 应用程序/库,不一定在 Java 中,然后与它们集成。

标签: java speech-recognition speech-to-text


【解决方案1】:

有许多技术和服务可用于执行语音识别。有关某些选项的介绍,请参阅https://stackoverflow.com/a/6351055/90236

我不确定将英语作为第二语言教孩子的结果是否可以接受,但值得一试。

【讨论】:

    【解决方案2】:

    您所寻求的是当前突破性的技术。 cmusphinx 之类的工具可以从专门的、有限的字典中检测单词(因此你可以教它理解,比如 15 个单词,仅此而已 - 你不能教它理解英语)。

    基本上,这些工具会尝试在您输入的声波中找到模式。他们什么都不懂,他们只是在任何事情上使用相同的算法,然后尝试找到最接近的匹配。这适用于少量单词,但随着单词数量的增加,两者之间的差异会缩小,并且工作变得越来越难(甚至不用像 if and weather 或 C and see 这样的词开始)。

    您可能会考虑“跟我重复”软件。在这里,您需要将测试的所有单词记录为模板。然后你可以记录学生的话,然后计算差异。如果差异不是太大,则该词是正确的。但再说一遍:这是简单的重复以提高发音 - 不是英语。

    有可以理解很多英语的桌面软件(例如Nuance的产品,Dragon Naturally speak是最突出的产品之一)。他们确实提供服务器解决方案,但如果您预算紧张,该软件既不免费也不便宜。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-09-02
      • 2020-12-08
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多