【发布时间】:2020-07-02 18:20:20
【问题描述】:
我想从互联网上下载几个大文件(特别是从网站 PushShift 提交的 Reddit 每月提交的文件)到 S3 存储桶中。我通过 SSH 连接到 EC2 实例并运行 Jupyter 笔记本。
理想情况下,我希望能够在我的 EC2 实例的 Jupyter 笔记本中编写 Python 脚本,该脚本从 Internet 下载文件,然后将其推送到我的 S3 存储桶。我该怎么做呢?
【问题讨论】:
-
这本质上是两个问题“如何从 S3 下载文件?”和“如何将文件上传到 S3?”。这两个问题已经在这个网站和其他地方有大量的答案。
-
我不想下载和上传,我本质上是想使用 EC2 将文件直接从网站流式传输到 S3
标签: python amazon-web-services amazon-s3 amazon-ec2 jupyter-notebook