【问题标题】:How to use the voice element with different voices in ssml?如何在ssml中使用不同声音的语音元素?
【发布时间】:2019-09-21 01:43:05
【问题描述】:

我尝试使用 Google Text-To-Speech API 生成音频文件。因为我在对话中需要不同的声音,所以我尝试使用 ssml 的语音元素:

<speak>
<voice languages="en-US" gender="female" name="en-US-Wavenet-F">Have you got a girlfriend?</voice>
<voice languages="en-GB" gender="male" name="en-GB-Wavenet-B">Yes, I have.</voice>
</speak>

但它不起作用,只会识别性别属性 - 但只能识别默认语音,而不是选定的 Wavenet 语音。

我的问题 - 有没有办法在一个 ssml 文件中使用不同的 Wavenet 语音,或者我只能为整个文件全局定义语音?

【问题讨论】:

    标签: google-cloud-platform text-to-speech google-text-to-speech


    【解决方案1】:

    我一直面临同样的问题,不幸的是,根据documentation,目前似乎不支持voice 元素:

    请注意,Cloud Text-to-Speech 目前并不支持 W3 SSML 规范中描述的所有元素和选项。此页面详细说明了哪些元素和选项可用于您的应用程序。下面提供的 W3 参考链接可能对其他上下文和示例有所帮助。

    我猜你最好的办法是创建几个文件,然后将它们连接起来,至少我会这样做。

    【讨论】:

      【解决方案2】:

      有趣的是,您无法使用 Cloud Text To Speech 中的标签更改语音性别,已使用“立即将您的文本转换为语音”模拟器 here 进行测试,但使用 Google Actions 中的 TTS emulator 可以做到这一点,但 SSML 的两个引用都相同 12

      created 一个功能请求在公共问题跟踪器上具有“语音选项”,您可以对其加注星标以便在更新时收到通知。请记住,我们没有 ETA。

      【讨论】:

        猜你喜欢
        • 2022-01-21
        • 2013-04-08
        • 2020-03-16
        • 2012-05-05
        • 1970-01-01
        • 2021-12-14
        • 1970-01-01
        • 1970-01-01
        • 2017-07-30
        相关资源
        最近更新 更多