【发布时间】:2019-04-14 07:41:54
【问题描述】:
我实际上使用 Pocketsphinx for Speech-To-Text 一个音频文件。
我使用这个命令:
pocketsphinx_continuous -logfn /dev/null -infile audio.wav > text.txt
我想知道是否有办法获取每个单词的时间戳。就这样:
startTime: 0.000s, endTime: 0.200s, word: hello
startTime: 0.250s, endTime: 0.500s, word: world
我没有必要使用 Pocketsphinx,但我需要一种免费且不受限制的方式在 Linux 上将语音转文本作为音频文件。
【问题讨论】:
-
你可以加
-time yes,它会打印时间。 -
感谢@NikolayShmyrev,它正在工作!请将其发布为答案,因为我可以将其作为正确答案
标签: bash speech-recognition speech-to-text pocketsphinx