【发布时间】:2024-05-15 22:00:02
【问题描述】:
当得知 Google 终于发布了面向开发者的官方语音 API 时,我感到非常兴奋。我一直对 Google 的语音识别在 Android、Chrome 和其他产品中的出色表现感到惊讶。
我创建了一个 Google Cloud 帐户,启用了语音 API,并在 Google Speech API documentation 之后创建了一些测试脚本。准确率超高,但速度慢得离谱。一个 18 秒的音频文件将花费他们的引擎大约 16 秒的时间来转录! Microsoft Bing Speech API 只需 3-4 秒即可完成!
有没有人有同样的经历?还是我的配置有问题?非常感谢任何帮助!
这是我使用的代码:
重击:
time curl "https://speech.googleapis.com/v1beta1/speech:syncrecognize?key={MY_API_KEY}" --header "Content-Type: application/json" --data '{"config":{"encoding":"FLAC","sample_rate":16000,"language_code":"en-US"},"audio":{"uri":"gs://accobot-speech/new_record.flac"}}'
【问题讨论】:
-
我也注意到了这一点。
-
我会在 21 秒内收到您的文件的回复。这里也有讨论code.google.com/p/google-cloud-platform/issues/detail?id=94
标签: google-app-engine google-speech-api