如何在ssml中使用不同声音的语音元素？答案

【问题标题】：How to use the voice element with different voices in ssml?如何在ssml中使用不同声音的语音元素？
【发布时间】：2019-09-21 01:43:05
【问题描述】：

我尝试使用 Google Text-To-Speech API 生成音频文件。因为我在对话中需要不同的声音，所以我尝试使用 ssml 的语音元素：

<speak>
<voice languages="en-US" gender="female" name="en-US-Wavenet-F">Have you got a girlfriend?</voice>
<voice languages="en-GB" gender="male" name="en-GB-Wavenet-B">Yes, I have.</voice>
</speak>

但它不起作用，只会识别性别属性 - 但只能识别默认语音，而不是选定的 Wavenet 语音。

我的问题 - 有没有办法在一个 ssml 文件中使用不同的 Wavenet 语音，或者我只能为整个文件全局定义语音？

【问题讨论】：

标签： google-cloud-platform text-to-speech google-text-to-speech

【解决方案1】：

我一直面临同样的问题，不幸的是，根据documentation，目前似乎不支持voice 元素：

请注意，Cloud Text-to-Speech 目前并不支持 W3 SSML 规范中描述的所有元素和选项。此页面详细说明了哪些元素和选项可用于您的应用程序。下面提供的 W3 参考链接可能对其他上下文和示例有所帮助。

我猜你最好的办法是创建几个文件，然后将它们连接起来，至少我会这样做。

【讨论】：

【解决方案2】：

有趣的是，您无法使用 Cloud Text To Speech 中的标签更改语音性别，已使用“立即将您的文本转换为语音”模拟器 here 进行测试，但使用 Google Actions 中的 TTS emulator 可以做到这一点，但 SSML 的两个引用都相同 1、2。

我created 一个功能请求在公共问题跟踪器上具有“语音选项”，您可以对其加注星标以便在更新时收到通知。请记住，我们没有 ETA。

【讨论】：