【发布时间】:2021-10-18 16:00:56
【问题描述】:
用 Python 解决以下问题的最佳方法是什么?
我有实时数据流从用户应用程序进入我的面向对象存储(json 文件存储到亚马逊的 S3 存储中)。
收到每个 JSON 文件后,我必须在一定时间内(在本例中为 1 秒)处理文件中的数据并生成发送回用户的响应。这些数据正在由简单的 Python 脚本处理。
我的问题是,实时数据流可以同时从用户应用程序生成数百个 JSON 文件,我需要通过我的 Python 脚本运行这些文件,但我不知道如何以最佳方式处理这个问题.
我了解,解决此问题的方法是使用基于触发器的 Lambda,一旦从无服务器环境中的实时流上传,该 Lambda 将在每个文件的顶部执行作业,但是与使用此选项相比,此选项相当昂贵单个服务器实例运行并以某种方式触发内部作业。
感谢任何建议。谢谢。
【问题讨论】:
标签: python amazon-s3 amazon-ec2 aws-lambda concurrency