【发布时间】:2016-08-27 22:32:18
【问题描述】:
我在写python爬虫的时候,经常使用urlopen。有时候打不开url(所以报错),但是当我重试打开这个url时,就成功了。所以我通过这样编写爬虫来处理这种情况:
def url_open(url):
'''open the url and return its content'''
req = urllib.request.Request(headers=header, url=url)
while True:
try:
response = urllib.request.urlopen(req)
break
except:
continue
contents = response.read().decode('utf8')
return contents
我认为这段代码很丑……但它可以工作,那么有什么优雅的方法可以做到这一点吗?
【问题讨论】:
标签: python web-crawler urlopen