【问题标题】:Get Timestamps of words (Speech-To-Text)获取单词的时间戳(Speech-To-Text)
【发布时间】:2019-04-14 07:41:54
【问题描述】:

我实际上使用 Pocketsphinx for Speech-To-Text 一个音频文件。
我使用这个命令:

pocketsphinx_continuous -logfn /dev/null -infile audio.wav > text.txt

我想知道是否有办法获取每个单词的时间戳。就这样:

startTime: 0.000s, endTime: 0.200s, word: hello
startTime: 0.250s, endTime: 0.500s, word: world

我没有必要使用 Pocketsphinx,但我需要一种免费且不受限制的方式在 Linux 上将语音转文本作为音频文件。

【问题讨论】:

  • 你可以加-time yes,它会打印时间。
  • 感谢@NikolayShmyrev,它正在工作!请将其发布为答案,因为我可以将其作为正确答案

标签: bash speech-recognition speech-to-text pocketsphinx


【解决方案1】:

感谢@NikolayShmyrev, 答案就是在命令中添加-time yes

【讨论】:

    猜你喜欢
    • 2019-12-14
    • 1970-01-01
    • 2019-11-12
    • 2015-11-28
    • 1970-01-01
    • 1970-01-01
    • 2022-10-18
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多