【问题标题】:Can't download a file through urllib无法通过 urllib 下载文件
【发布时间】:2017-09-16 11:14:17
【问题描述】:

所以,我有一个使用 bs4 获取一些链接的刮板,然后我愿意下载这些链接,但问题是,当我点击下载按钮时,我的浏览器会自动开始下载链接的 zip 文件间接指向,但是当我给 urllib 相同的链接时,它总是最终下载页面而不是 zip 文件!

我刮出来的链接是:Link I got from scraping

链接到我为该链接废弃的页面:Main Page

在此主页上,该链接的文本为“4931x”

现在,当我通过浏览器单击相同的链接时,它会以某种方式重定向到:Redirected link

但即使我将 urlopen 与第三个链接一起使用,我也会再次重定向到第一个链接!

我觉得这是一个愚蠢的问题,可能有一个非常简单的解决方案,但我似乎真的无法解决它。我只想通过urlopen自动下载压缩的字幕,但我不能!

【问题讨论】:

    标签: python urllib urlopen


    【解决方案1】:

    正如您的 Web 浏览器开发工具的网络面板将显示的那样,原始 URL 返回一个 HTTP 302 响应,其中包含重定向到 https://www.flixtools.com/en/osflixtools.subtitles-download/subtitles/6647724?source=source_os_landing&campaign=campaign_sub_landing 的位置标头。该页面包含以下 HTML:<meta http-equiv="refresh" content="5; URL=//dl.opensubtitles.org/en/download/vrf-108d030f/sub/6647724">。这会指示您的网络浏览器在等待 5 秒后导航到该 URL。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-03-03
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-06-02
      • 2017-07-04
      • 2014-08-02
      相关资源
      最近更新 更多