【发布时间】:2018-04-02 17:58:27
【问题描述】:
无法读取txt文件中的url 想把txt中的url地址一一读取打开,想从url地址的源头用正则表达式获取标题的标题 错误信息:
Traceback(最近一次调用最后一次):文件“Mypy.py”,第 14 行,在 UrlsOpen = urllib2.urlopen(listSplit) 文件“/usr/lib/python2.7/urllib2.py”,第 154 行,在 urlopen 返回 opener.open(url, data, timeout) 文件“/usr/lib/python2.7/urllib2.py”,第 420 行,打开 req.timeout = timeout AttributeError: 'list' 对象没有属性 'timeout'
Mypy.py
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import re
import requests
import urllib2
import threading
UrlListFile = open("Url.txt","r")
UrlListRead = UrlListFile.read()
UrlListFile.close()
listSplit = UrlListRead.split('\r\n')
UrlsOpen = urllib2.urlopen(listSplit)
ReadSource = UrlsOpen.read().decode('utf-8')
regex = '<title.*?>(.+?)</title>'
comp = re.compile(regex)
links = re.findall(comp,ReadSource)
for i in links:
SaveDataFiles = open("SaveDataMyFile.txt","w")
SaveDataFiles.write(i)
SaveDataFiles.close()
【问题讨论】:
-
你能添加一个
Url.txt内容的例子吗? -
@fievel 我的 Url.txt i.stack.imgur.com/s81Mt.png
-
您可以复制 URL.txt 文件的内容并使用代码格式将其粘贴到您的问题中吗?帮助您调试会更容易