【发布时间】:2009-09-30 17:40:01
【问题描述】:
我有很多 WMA 格式的语音音频,我想对其进行机器转录 - 即使转录不是 100% 准确,我认为它可以作为一些“索引”来帮助一些人的音频。我愿意编写一些代码来实现这一点,但微软的语音 API 可以帮助我吗?是否已经有可以为我执行此操作的应用程序?
【问题讨论】:
标签: speech-to-text
我有很多 WMA 格式的语音音频,我想对其进行机器转录 - 即使转录不是 100% 准确,我认为它可以作为一些“索引”来帮助一些人的音频。我愿意编写一些代码来实现这一点,但微软的语音 API 可以帮助我吗?是否已经有可以为我执行此操作的应用程序?
【问题讨论】:
标签: speech-to-text
SAPI 当然可以做你想做的事。从进程内识别器开始,将音频连接为文件流(您可能需要将 WMA 文件转码为 WAV 流,因为 SAPI 只接受 WAV 输入,但您可以即时进行转码),设置听写模式,然后出发。
现在是令人失望的一点。你可能不会得到非常好的结果;事实上,我怀疑除非你非常幸运,否则你可能会得到完全的垃圾。
有几个问题:
我实际上建议使用 Dragon Naturally speak Professional;他们花费了时间和金钱来进行转录工作。我自己没用过,不知道在你的情况下效果如何。
【讨论】:
你需要一个相应的程序来实现这一点,比如听写软件。 Speech API 则相反。我也不相信这有什么开源的,因为这是一个非常非常复杂的软件。
【讨论】: