如何将云语音中超过 1 分钟的音频片段转录为文本 API？答案

【问题标题】：How to transcribe more than 1 minute audio clip in cloud speech to text API?如何将云语音中超过 1 分钟的音频片段转录为文本 API？
【发布时间】：2019-04-09 08:41:33
【问题描述】：

我的问题是，我尝试使用 Google Cloud 及其工作转录不到一分钟的音频剪辑，但是当我尝试多一分钟时它不起作用。所以我的问题是，如何转录超过一分钟的音频或没有限制？

【问题讨论】：

标签： android google-cloud-platform google-cloud-speech

【解决方案1】：

来自https://cloud.google.com/speech-to-text/quotas#content：

超过约 1 分钟的音频必须使用 uri 字段来引用 Google Cloud Storage 中的音频文件。

因此，在转录之前将文件存储在 Google 存储中。

【讨论】：

本地文件不可以吗？一定有办法
我不相信，而是上传然后转录。

【解决方案2】：

使用同步语音识别Transcribing Short audio file 转录短音频文件。如果您的音频文件超过 1 分钟，则使用异步语音识别。

考虑这个来自文档Transcribing long audio file 的示例。您可以在 Cloud Shell 中运行以下示例命令。您只需在 GCS 中上传 (how to upload objects to GCS) 您的音频文件，然后将其用作您的输入。

gcloud ml speech recognize-long-running \
'gs://gcs-test-data/vr.flac' \
 --language-code='en-US' --async

gcloud ml speech operations describe [OPERATION_ID]

【讨论】：

请注意0到60分钟（每月）的定价是免费的，超出的部分相应收费cloud.google.com/speech-to-text/pricing