如何将 AWS Kinesis 视频流的音频流输出馈送到 AWS Transcribe 服务？答案

【问题标题】：How to feed the audio stream output of the AWS Kinesis video stream to AWS Transcribe service?如何将 AWS Kinesis 视频流的音频流输出馈送到 AWS Transcribe 服务？
【发布时间】：2019-03-17 05:21:11
【问题描述】：

如何将 AWS Kinesis 视频流 (KVS) 的音频流输出馈送到 AWS Transcribe 服务并获得实时音频到文本的转换？我通过亚马逊连接到 KVS（Kinesis 视频流）摄取音频，我担心的是，哪种格式的 kinesis 视频流 (KVS) 提供（我希望它的有效负载格式）以及 Transcribe 服务是否能够支持它或我可以转换为 Transcribe 的任何方式服务可以理解。

【问题讨论】：

@John Rotenstein 创建了一个新问题(stackoverflow.com/questions/49746612/…)，请帮助我。
是什么让您认为这样的联系是可能的？你有任何参考资料吗？我只能找到aws-samples/amazon-connect-realtime-transcription: Transcribe Live Customer Audio for Amazon Connect using Amazon Kinesis Video Streams and Amazon Transcribe，它使用 AWS Lambda 来触发 AWS Transcribe。你想要达到什么最终目标（例如你的输入是什么，你想要的输出是什么）？
@John Rotenstein 是的，你粘贴的 github 链接是我想要实现的，但是在那个链接中我应该知道 java，我知道 python，所以我决定使用 python、awscli 或 boto 模块.我的流程是 aws-connect---将数据推送到 --->Kinesis -------> 转码器 ----> 文本 ------> 使用 comprehend 选择所需的----> 插入数据库。我想转录的实时客户电话，没有离线的想法，它需要实时完成，所以使用 Kinesis 否则会将音频保存到 S3，然后使用转码器进行转换

标签： python-3.x aws-lambda boto3 amazon-kinesis aws-transcribe

【解决方案1】：

对我来说，我修改了 AWS CLI，两阶段进程，尽管来自 get-data-endpoint 的输出直接发送给单个命令行执行：

export ARN=arn:aws:kinesisvideo:XXX
aws kinesis-video-media get-media --stream-arn ${ARN} --start-selector StartSelectorType=EARLIEST outfile --endpoint-url `aws kinesisvideo get-data-endpoint --stream-arn ${ARN} --api-name GET_MEDIA --output text`

这让我得到了我可以根据需要处理的文件......显然，我的所有 AWS 凭证等都已配置。

HTH - 罗伯特...

【讨论】：

输出是文本？你能把输出作为媒体播放吗？
该aws 命令下载到outfile（值得检查您正在使用的StartSelectorType 值），但您可能会发现该文件无论如何都没有多大用处，您会想从@john-rotenstein提供的github链接中关注实现...