【发布时间】:2015-08-16 06:57:57
【问题描述】:
我正在尝试使用 python 从网站中提取指标:http://www.bild.de/regional/hamburg/mord/das-denkt-der-presserat-ueber-den-mord-an-unserer-tochter-lisa-41186944.bild.html
我需要黄色“LACHEN”按钮(现在为 149)下的文本(数字)。该特定元素的 XPath 是 //*[@id="jsm_16584"]/ul/li[1]/span
但是当我尝试查询它时它不会返回任何对象:
url = "http://www.bild.de/regional/hamburg/mord/das-denkt-der-presserat-ueber-den-mord-an-unserer-tochter-lisa-41186944.bild.html"
req=urllib2.Request(url)
tree = lxml.html.fromstring(urllib2.urlopen(req).read())
metric=tree.xpath('//*[@id="jsm_16584"]/ul/li[1]/span')
print metric
它以空列表的形式返回metric。
【问题讨论】:
-
你所追求的值是用javascript动态更新的。我认为您无法使用 xpath 提取它。
-
有没有其他方法可以做到这一点?