【发布时间】:2018-01-02 08:23:35
【问题描述】:
我正在尝试使用 xpath/lxml 从http://www.cellartracker.com/wine.asp?iWine=91411 中的“drink between: 2005 - 2013”的文本中抓取文本“2005-2013”,并且只能为其他一些这个网站上的页面,而不是这个。不确定我做错了什么/如果我从元素复制的 xpath 不正确
它告诉我:
print(content_divs[0].text_content().strip())
IndexError: list index out of range
这是我的代码:
import requests, lxml.html
page = requests.get('http://www.cellartracker.com/wine.asp?iWine=91411')
html = lxml.html.fromstring(page.content)
content_divs = html.xpath('//*[@id="wine_copy_inner"]/p/a[4]')
print(content_divs[0].text_content().strip())
感谢您的帮助!!!
【问题讨论】:
标签: python xpath web-scraping beautifulsoup lxml