【发布时间】:2015-09-29 18:20:19
【问题描述】:
我正在尝试从 Python 中下载文件,我尝试了 urllib 和 requests,但都给我一个超时错误。文件位于:http://www.prociv.pt/cnos/HAI/Setembro/Incêndios%20Rurais%20-%20Histórico%20do%20Dia%2029SET.pdf
使用请求:
r = requests.get('http://www.prociv.pt/cnos/HAI/Setembro/Incêndios%20Rurais%20-%20Histórico%20do%20Dia%2029SET.pdf',timeout=60.0)
使用 urllib:
urllib.urlretrieve('http://www.prociv.pt/cnos/HAI/Setembro/Incêndios%20Rurais%20-%20Histórico%20do%20Dia%2029SET.pdf','the.pdf')
我尝试过不同的网址,例如:
- http://www.prociv.pt/cnos/HAI/Setembro/Incêndios Rurais - Histórico do Dia 29SET.pdf
- http://www.prociv.pt/cnos/HAI/Setembro/Inc%C3%AAndios%20Rurais%20-%20Hist%C3%B3rico%20do%20Dia%2029SET.pdf
- http://www.prociv.pt/cnos/HAI/Setembro/Incêndios%20Rurais%20-%20Histórico%20do%20Dia%2029SET.pdf
而且,我可以使用浏览器下载它,也可以使用以下语法使用 cURL:
curl http://www.prociv.pt/cnos/HAI/Setembro/Inc%C3%AAndios%20Rurais%20-%20Hist%C3%B3rico%20do%20Dia%2029SET.pdf
所以我怀疑这是一个编码问题,但我似乎无法让它工作。有什么建议吗?
编辑:清晰度。
【问题讨论】:
标签: python pdf python-requests urllib