无法通过 urllib 下载文件答案

【问题标题】：Can't download a file through urllib无法通过 urllib 下载文件
【发布时间】：2017-09-16 11:14:17
【问题描述】：

所以，我有一个使用 bs4 获取一些链接的刮板，然后我愿意下载这些链接，但问题是，当我点击下载按钮时，我的浏览器会自动开始下载链接的 zip 文件间接指向，但是当我给 urllib 相同的链接时，它总是最终下载页面而不是 zip 文件！

我刮出来的链接是：Link I got from scraping

链接到我为该链接废弃的页面：Main Page

在此主页上，该链接的文本为“4931x”

现在，当我通过浏览器单击相同的链接时，它会以某种方式重定向到：Redirected link

但即使我将 urlopen 与第三个链接一起使用，我也会再次重定向到第一个链接！

我觉得这是一个愚蠢的问题，可能有一个非常简单的解决方案，但我似乎真的无法解决它。我只想通过urlopen自动下载压缩的字幕，但我不能！

【问题讨论】：

【解决方案1】：

正如您的 Web 浏览器开发工具的网络面板将显示的那样，原始 URL 返回一个 HTTP 302 响应，其中包含重定向到 https://www.flixtools.com/en/osflixtools.subtitles-download/subtitles/6647724?source=source_os_landing&campaign=campaign_sub_landing 的位置标头。该页面包含以下 HTML：<meta http-equiv="refresh" content="5; URL=//dl.opensubtitles.org/en/download/vrf-108d030f/sub/6647724">。这会指示您的网络浏览器在等待 5 秒后导航到该 URL。

【讨论】：