【发布时间】:2013-06-29 03:57:46
【问题描述】:
我有一个网站,我想从中下载文件。大约每隔一天上传一个新文件。如何检查新文件是否已启动?
例如: url1 = website.com/file_2013-06-27.zip
url2 = website.com/file_2013-06-29.zip
如果我转到 url 2,它会在 5 秒内重定向回 website.com
它的源代码是:<meta http-equiv="refresh" content="5;url=http://website.com" /> Error: 2 [ Not Allowed ]
文件大小为100mb+,如果我尝试通过urllib.urlopen("website.com/file_2013-06-27.zip").read()查看源代码,如果文件存在则需要一段时间。
有什么方法可以快速检查是否上传了新文件?
谢谢
【问题讨论】:
-
如果服务器支持这个,可以发出HEAD请求;如果没有,只需发出 GET 请求,并通过套接字仅读取标头(即第一个空行之前的所有内容)。
-
谢谢,我用过:
import httplib2 h = httplib2.Http() resp = h.request("http://www.google.com", 'HEAD')[0]['content-type']from:stackoverflow.com/questions/4421170/…