【发布时间】:2015-02-05 08:22:10
【问题描述】:
据此answer:
>>> from lxml.html import fromstring
>>> s = """<input type="hidden" name="question" value="1234">"""
>>> doc = fromstring(s)
>>> doc.value
'1234'
>>> doc.name
'question'
我试图从这段代码中获取链接和文本:
from lxml.html import fromstring
s = '<a href="http://a.com" rel="bookmark">bla bla bla</a>'
doc = fromstring(s)
print (doc.href)
print (doc.text_content())
它给出了AttributeError:'HtmlElement' object has no attribute 'href'
我是 lxml 的新手。其实问题出在哪里?
如何将链接 (a.com) 和文本 (bla bla bla) 作为此代码中的字符串?
【问题讨论】:
标签: python-3.4 lxml.html