【问题标题】:Speech Recognition of Emergency Radio Recordings紧急无线电录音的语音识别
【发布时间】:2017-12-21 20:38:20
【问题描述】:

语音识别新手,请原谅我的无知。我正在尝试获取紧急广播通知的抄本example1example2。显然,我做错了什么,因为没有任何高级 ASR(自动语音识别)工具可以从中获得任何意义。

我试过IBM WatsonGoogle Speech 甚至Cobalt。他们甚至都无法从音频中收集到最基本的信息。

所以这是由两部分组成的问题。是否可以通过 ASR 工具使用上述示例中的音频?在通过 API 发送之前我应该​​做一些转换吗?

【问题讨论】:

  • 你了解语音识别的工作原理吗?

标签: speech-recognition


【解决方案1】:

上述示例中的音频是否可以通过 ASR 工具使用?

是的,您可以非常可靠地识别此类事物,但您必须构建自定义 ASR 系统,因为传统的 ASR 系统无法处理此类音频质量。

在通过 API 发送之前我应该​​做一些转换吗?

不,使用针对您的特定类型数据进行训练的专门模型效率更高。

Cobalt 可以为此构建自定义解决方案。您可以使用 Kaldi 等开源工具包自己构建模型。另一家为这种音频检查专门解决方案的公司是Adacel,他们在机场塔楼上工作,所以有类似类型的音频。

有关该主题的研究,您可以查看有关自定义 Apollo mission transcription system 的项目。

您还需要付出更多努力来获得更高质量的音频。

【讨论】:

  • 太棒了!虽然看起来我已经完成了我的工作,但这正是我需要知道的。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-08-14
  • 1970-01-01
  • 1970-01-01
  • 2022-12-30
  • 2021-07-15
  • 1970-01-01
相关资源
最近更新 更多