【发布时间】:2015-02-27 14:14:45
【问题描述】:
如果有人能帮助我解决我遇到的这个问题,我将不胜感激。
我正在尝试使用请求库从 Internet 下载 .gz 文件。我之前已经成功使用lib来获取解析到浏览器的xml数据,但是.gz版本不起作用。
在我的浏览器中单击 URL_To_Gzip 链接后,.gz 文件会自动开始下载文件。 --> 所以 url 没问题,但只是直接指向文件。
我正在尝试在 python 2.7 中对此进行编码,以便随后处理其中包含的文件和数据,但我收到一条我正在努力解决的错误消息。
错误信息:
HTTPSConnectionPool(host=HOST_URL_TO_GZip, port=443): Max retries exceeded with url: URL_TO_GZip.gz (原因:[Errno 10060] 连接尝试失败,因为连接方在一段时间后没有正确响应,或者已建立的连接失败,因为连接的主机没有响应)
import requests
data = requests.get(url_to_gzip,proxies = {"http":proxy_url}) # Does not work data = #Does not work
data = requests.get(url_to_gzip,proxies = {"http":proxy_url}, stream = True) # Does not work
Errno 10060 上的信息表明该错误与我的代理有关,因为无法建立连接。 --> 但是我已经成功使用这些来获取类似版本的xml数据。
谢谢,
拉维
编辑
URL_TO_GZip.gz 文件是通过 https:// 实现的,而可以正常工作的 xml 文件是通过 http:// 实现的,我认为这是我的问题的原因以及为什么它适用于一个文件而不适用于另一个文件。
【问题讨论】:
标签: python download request gzip