将文件从 Internet 直接下载到我的 S3 存储桶答案

【问题标题】：Download a file from the Internet directly to my S3 bucket将文件从 Internet 直接下载到我的 S3 存储桶
【发布时间】：2015-08-24 10:59:15
【问题描述】：

我正在 AWS 基础设施上使用 EMR（弹性 MapReduce），为程序提供输入文件（大型数据集）的默认方式是将它们上传到 S3 存储桶并引用那些存储桶在 EMR 中。

通常我将数据集下载到我的本地开发机器，然后将它们上传到 S3，但是对于较大的文件，这变得越来越难，因为上传速度通常远低于下载速度。

我的问题是有没有办法从互联网上下载文件（给定他们的 URL）直接到 S3，所以我不必将它们下载到我的本地机器然后手动上传？

【问题讨论】：

【解决方案1】：

没有。您需要一个中介 - 通常使用 EC2 实例，而不是您的本地机器，以提高速度。

【讨论】：