【问题标题】:Download a file from the Internet directly to my S3 bucket将文件从 Internet 直接下载到我的 S3 存储桶
【发布时间】:2015-08-24 10:59:15
【问题描述】:

我正在 AWS 基础设施上使用 EMR(弹性 MapReduce),为程序提供输入文件(大型数据集)的默认方式是将它们上传到 S3 存储桶并引用 那些 存储桶在 EMR 中。

通常我将数据集下载到我的本地开发机器,然后将它们上传到 S3,但是对于较大的文件,这变得越来越难,因为上传速度通常远低于下载速度。

我的问题是有没有办法从互联网上下载文件(给定他们的 URL)直接到 S3,所以我不必将它们下载到我的本地机器然后手动上传?

【问题讨论】:

标签: hadoop amazon-web-services amazon-s3 emr


【解决方案1】:

没有。您需要一个中介 - 通常使用 EC2 实例,而不是您的本地机器,以提高速度。

【讨论】:

    猜你喜欢
    • 2013-10-15
    • 2021-04-11
    • 2019-02-16
    • 1970-01-01
    • 2021-08-13
    • 1970-01-01
    • 2015-05-20
    • 1970-01-01
    • 2017-02-16
    相关资源
    最近更新 更多