【发布时间】:2011-05-25 21:20:55
【问题描述】:
我正在编写一个脚本来读取网页,并建立一个符合特定条件的链接数据库。现在我被 lxml 困住了,并且了解如何从 html 中获取所有 <a href>...
result = self._openurl(self.mainurl)
content = result.read()
html = lxml.html.fromstring(content)
print lxml.html.find_rel_links(html,'href')
【问题讨论】:
-
这个问题已经被问了几十次了,答案很好,例如:stackoverflow.com/questions/1080411/…