【问题标题】:How to transcribe more than 1 minute audio clip in cloud speech to text API?如何将云语音中超过 1 分钟的音频片段转录为文本 API?
【发布时间】:2019-04-09 08:41:33
【问题描述】:

我的问题是,我尝试使用 Google Cloud 及其工作转录不到一分钟的音频剪辑,但是当我尝试多一分钟时它不起作用。 所以我的问题是,如何转录超过一分钟的音频或没有限制?

【问题讨论】:

    标签: android google-cloud-platform google-cloud-speech


    【解决方案1】:

    来自https://cloud.google.com/speech-to-text/quotas#content

    • 超过约 1 分钟的音频必须使用 uri 字段来引用 Google Cloud Storage 中的音频文件。

    因此,在转录之前将文件存储在 Google 存储中。

    【讨论】:

    • 本地文件不可以吗?一定有办法
    • 我不相信,而是上传然后转录。
    【解决方案2】:

    使用同步语音识别Transcribing Short audio file 转录短音频文件。如果您的音频文件超过 1 分钟,则使用异步语音识别。

    考虑这个来自文档Transcribing long audio file 的示例。您可以在 Cloud Shell 中运行以下示例命令。您只需在 GCS 中上传 (how to upload objects to GCS) 您的音频文件,然后将其用作您的输入。

    gcloud ml speech recognize-long-running \
    'gs://gcs-test-data/vr.flac' \
     --language-code='en-US' --async
    
    gcloud ml speech operations describe [OPERATION_ID]
    

    【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2019-07-10
    • 1970-01-01
    • 2018-07-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多