【问题标题】:How to feed the audio stream output of the AWS Kinesis video stream to AWS Transcribe service?如何将 AWS Kinesis 视频流的音频流输出馈送到 AWS Transcribe 服务?
【发布时间】:2019-03-17 05:21:11
【问题描述】:

如何将 AWS Kinesis 视频流 (KVS) 的音频流输出馈送到 AWS Transcribe 服务并获得实时音频到文本的转换?我通过亚马逊连接到 KVS(Kinesis 视频流)摄取音频,我担心的是,哪种格式的 kinesis 视频流 (KVS) 提供(我希望它的有效负载格式)以及 Transcribe 服务是否能够支持它或我可以转换为 Transcribe 的任何方式服务可以理解。

【问题讨论】:

  • @John Rotenstein 创建了一个新问题(stackoverflow.com/questions/49746612/…),请帮助我。
  • 是什么让您认为这样的联系是可能的?你有任何参考资料吗?我只能找到aws-samples/amazon-connect-realtime-transcription: Transcribe Live Customer Audio for Amazon Connect using Amazon Kinesis Video Streams and Amazon Transcribe,它使用 AWS Lambda 来触发 AWS Transcribe。你想要达到什么最终目标(例如你的输入是什么,你想要的输出是什么)?
  • @John Rotenstein 是的,你粘贴的 github 链接是我想要实现的,但是在那个链接中我应该知道 java,我知道 python,所以我决定使用 python、awscli 或 boto 模块.我的流程是 aws-connect---将数据推送到 --->Kinesis -------> 转码器 ----> 文本 ------> 使用 comprehend 选择所需的----> 插入数据库。我想转录的实时客户电话,没有离线的想法,它需要实时完成,所以使用 Kinesis 否则会将音频保存到 S3,然后使用转码器进行转换

标签: python-3.x aws-lambda boto3 amazon-kinesis aws-transcribe


【解决方案1】:

对我来说,我修改了 AWS CLI,两阶段进程,尽管来自 get-data-endpoint 的输出直接发送给单个命令行执行:

export ARN=arn:aws:kinesisvideo:XXX
aws kinesis-video-media get-media --stream-arn ${ARN} --start-selector StartSelectorType=EARLIEST outfile --endpoint-url `aws kinesisvideo get-data-endpoint --stream-arn ${ARN} --api-name GET_MEDIA --output text`

这让我得到了我可以根据需要处理的文件......显然,我的所有 AWS 凭证等都已配置。

HTH - 罗伯特...

【讨论】:

  • 输出是文本?你能把输出作为媒体播放吗?
  • aws 命令下载到outfile(值得检查您正在使用的StartSelectorType 值),但您可能会发现该文件无论如何都没有多大用处,您会想从@john-rotenstein提供的github链接中关注实现...
猜你喜欢
  • 1970-01-01
  • 2020-11-27
  • 1970-01-01
  • 1970-01-01
  • 2021-09-03
  • 1970-01-01
  • 2021-08-27
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多