【发布时间】:2018-08-07 10:02:11
【问题描述】:
这个问题似乎以前被问过,但我以不同的方式做,所以我发布这个,因为我找不到解决这个问题的具体问题。有没有办法在不使用特殊工具或 Amazon CLI 等的情况下获取公共 Amazon 存储桶中的文件列表(实际上只是最新文件)?我对此没有任何经验,3小时后我准备把头发拉出来。我有一个简单的项目,我需要存储桶中的最新文件,但我不知道文件名。 (气象雷达数据)。这是唯一要求 - 我确实有少量的编程知识,但似乎我无法弄清楚 python/Amazon 工具,所以我只是想找到一条更简单的路线,因为我很快时间不多了。我正在使用 Windows 和命令行工具。在类似的主机上,我使用 wget 从服务器提取数据并使用我编写的简单 C++ 控制台应用程序解析 index.html 文件以获取文件名,然后启动 wget 下载文件,因为文件名很容易在索引。
对于亚马逊,我似乎无法弄清楚这一点。
这是主要列表:https://s3.amazonaws.com/noaa-nexrad-level2/index.html
由于文件名是按日期列出的,因此雷达站点 - 我可以找出大部分 URL。示例文件名是:
https://noaa-nexrad-level2.s3.amazonaws.com/2018/08/07/KEWX/KEWX20180807_094339_V06
举个更精确的例子——我需要https://noaa-nexrad-level2.s3.amazonaws.com/2018/08/07/KEWX 的最新文件。
如果我可以得到一个目录返回的 XML,我可以使用我之前做的方法来做到这一点……但我似乎无法弄清楚这一点。
我可以编写一个简单的程序来执行此操作,即使我必须学习一些 python(这似乎是最流行的方式),但我不明白我在做什么关于 AWS 身份验证、存储桶等,并且已经浪费了太多时间来重新开始,除非我得到一些认真的帮助。我希望能找到一些帮助。我不是想偷懒,我只是没有时间和想法。
【问题讨论】:
标签: amazon-web-services amazon-s3