【发布时间】:2017-02-17 19:12:55
【问题描述】:
我在 Python 2.7 中使用 urllib2 模块,使用 Spyder 3.0 通过读取包含文本文件列表的文本文件来批量下载文本文件:
reload(sys)
sys.setdefaultencoding('utf-8')
with open('ocean_not_templated_url.txt', 'r') as text:
lines = text.readlines()
for line in lines:
url = urllib2.urlopen(line.strip('ï \xa0\t\n\r\v'))
with open(line.strip('\n\r\t ').replace('/', '!').replace(':', '~'), 'wb') as out:
for d in url:
out.write(d)
我已经在我已经剥离的 url 中发现了一堆奇怪的字符,但是,脚本在完成近 90% 时失败,并出现以下错误:
我认为它是一个不间断的空格(在代码中用 \xa0 表示),但它仍然失败。有什么想法吗?
【问题讨论】: