【发布时间】:2020-02-05 01:13:50
【问题描述】:
我正在尝试将 OGG_OPUS 编码流发送到谷歌的语音到文本流服务。 由于 Google 对其流请求施加了时间限制,因此我必须以固定的时间间隔将音频流路由到另一个 Google Speech To Text 流会话。
据我所知,OGG流中的页面不能独立读取,因为页面中的数据是通过考虑前一页和下一页的数据来计算的。 如果是这样的话,我们是否可以在某个点切断流并用剩余的数据重新创建一个全新的流? 在某个点停止并在新流中发送数据是行不通的,因为初始 OGG 标头数据包在第二个流中也不可用。
我知道这个问题可以使用 PCM 数据来解决,因为它没有被编码,一个 PCM 流可以简单地在任何时候被分割并变成一个新的流。由于比特率高,我不能使用 PCM 流,而且我不喜欢使用无损质量,因为我正在传输语音数据流。
【问题讨论】:
-
你有测试代码或作品文件吗?试试下面的
OpusFileSplitter...
标签: javascript audio google-speech-api ogg opus