在 Python 错误中使用请求下载 .gz 文件答案

【问题标题】：Download .gz file using requests in Python Error在 Python 错误中使用请求下载 .gz 文件
【发布时间】：2015-02-27 14:14:45
【问题描述】：

如果有人能帮助我解决我遇到的这个问题，我将不胜感激。

我正在尝试使用请求库从 Internet 下载 .gz 文件。我之前已经成功使用lib来获取解析到浏览器的xml数据，但是.gz版本不起作用。

在我的浏览器中单击 URL_To_Gzip 链接后，.gz 文件会自动开始下载文件。 --> 所以 url 没问题，但只是直接指向文件。

我正在尝试在 python 2.7 中对此进行编码，以便随后处理其中包含的文件和数据，但我收到一条我正在努力解决的错误消息。

错误信息：

HTTPSConnectionPool(host=HOST_URL_TO_GZip, port=443): Max retries exceeded with url: URL_TO_GZip.gz （原因：[Errno 10060] 连接尝试失败，因为连接方在一段时间后没有正确响应，或者已建立的连接失败，因为连接的主机没有响应）

import requests 

data = requests.get(url_to_gzip,proxies = {"http":proxy_url}) # Does not work data = #Does not work

data = requests.get(url_to_gzip,proxies = {"http":proxy_url}, stream = True) # Does not work

Errno 10060 上的信息表明该错误与我的代理有关，因为无法建立连接。 --> 但是我已经成功使用这些来获取类似版本的xml数据。

谢谢，

拉维

编辑

URL_TO_GZip.gz 文件是通过 https:// 实现的，而可以正常工作的 xml 文件是通过 http:// 实现的，我认为这是我的问题的原因以及为什么它适用于一个文件而不适用于另一个文件。

【问题讨论】：

标签： python download request gzip

【解决方案1】：

对于遇到此问题的其他人，我需要添加一个 auth = (username, password) 关键字来访问 HTTPS 站点 auth keyword。

【讨论】：