【问题标题】:Is there a way to convert speech directly into SSML?有没有办法将语音直接转换为 SSML?
【发布时间】:2018-02-16 22:26:42
【问题描述】:

正如人们能够使用各种语音到文本的“听写”工具将口语单词转换为相应的文本一样,我想知道是否有类似的工具可以将口语单词转换为相应的 SSML。也就是说,除了与说话者声音中存在的任何语调、韵律、停顿/中断、变形等相关的 SSML 标签之外,它还将提供文本。

【问题讨论】:

    标签: text-to-speech speech-to-text speech-synthesis alexa-voice-service ssml


    【解决方案1】:

    我致力于构建语音应用程序。在我最近做的一个项目中,我们需要文本听起来完全正确,以及所有相关的语调、韵律、停顿/中断、变形等。 在广泛的研究中,我们发现让文本听起来像真人说话的唯一方法是使用 SSML(仍然不完美)或录制的 mp3。

    如果您想要让一个项目具有真实的个人感觉,那么执行它的最佳方式是利用人工。我建议您录制 mp3(/让专业人士录制),而不是尝试从语音中获取 SSML。

    我们使用 SSML 的原因正是因为计算机无法理解人类语音的相关语调、韵律、停顿/停顿、变形等。

    如果您的目标是获得 SSML,那么最好的方法是将文本转换为 SSML。为此,我建议在这里看看:

    W3C SSML

    Google SSML

    Amazon SSML

    据我们所知,这是在 2018 年 7 月中旬。 如果有人有更多信息,请随时添加到此答案中。

    希望这会有所帮助:3

    【讨论】:

    • 问题是关于使用某种语音转文本 (SSML) 生成 SSML。有很多可用的 STT 引擎,但它们为您提供纯文本而不是 SSML。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-01-24
    • 2011-06-25
    • 2017-02-14
    • 1970-01-01
    • 2014-11-06
    • 2017-03-25
    相关资源
    最近更新 更多