【发布时间】:2021-08-15 06:07:39
【问题描述】:
我是亚马逊 AWS 的新手。我有一个用例从一个 s3 存储桶读取 ORC 文件,将其转换为 JSON 文件并写入另一个 s3 存储桶。 容量约为 100G,每天大约有一千个文件。 我应该能够按需运行或安排每天运行。我应该考虑哪些选项?
任何想法都会有所帮助
【问题讨论】:
-
这一切都取决于文件的大小,你有多少。您根本没有在问题中提供太多信息,甚至没有开始考虑这个问题。
-
@Marcin 卷大约 100G,每天大约有一千个文件。
-
我的意思是一个文件有多大?如果它很小,可以使用 lambda,否则必须考虑其他服务。
-
@Marcin 文件的最大大小约为 100MB-200MB
-
那么这些文件是一个一个上传的,每次上传后都要转换一下吗?
标签: amazon-web-services amazon-s3 aws-lambda orc