紧急无线电录音的语音识别答案

【问题标题】：Speech Recognition of Emergency Radio Recordings紧急无线电录音的语音识别
【发布时间】：2017-12-21 20:38:20
【问题描述】：

语音识别新手，请原谅我的无知。我正在尝试获取紧急广播通知的抄本example1 example2。显然，我做错了什么，因为没有任何高级 ASR（自动语音识别）工具可以从中获得任何意义。

我试过IBM Watson、Google Speech 甚至Cobalt。他们甚至都无法从音频中收集到最基本的信息。

所以这是由两部分组成的问题。是否可以通过 ASR 工具使用上述示例中的音频？在通过 API 发送之前我应该做一些转换吗？

【问题讨论】：

【解决方案1】：

上述示例中的音频是否可以通过 ASR 工具使用？

是的，您可以非常可靠地识别此类事物，但您必须构建自定义 ASR 系统，因为传统的 ASR 系统无法处理此类音频质量。

在通过 API 发送之前我应该做一些转换吗？

不，使用针对您的特定类型数据进行训练的专门模型效率更高。

Cobalt 可以为此构建自定义解决方案。您可以使用 Kaldi 等开源工具包自己构建模型。另一家为这种音频检查专门解决方案的公司是Adacel，他们在机场塔楼上工作，所以有类似类型的音频。

有关该主题的研究，您可以查看有关自定义 Apollo mission transcription system 的项目。

您还需要付出更多努力来获得更高质量的音频。

【讨论】：