【发布时间】:2017-08-08 13:32:18
【问题描述】:
我正在使用 Scrapy 抓取一个网站,并希望在包含 ' 或 "的表中抓取项目
xpath = '//table/tbody/tr/td[contains(.,\"\'") or contains (.,\"\"\")]/text()'
但是,这会导致:
ValueError: XPath error: Invalid expression in XPATH
还有其他方法可以做到这一点吗? (我尝试使用 unicode 来表示 ' 和 " 但它不起作用。我也尝试过变量无济于事)
谢谢
【问题讨论】:
-
您忘记转义引号之一: //table/tbody/tr/td[contains(.,\"\'\") 或 contains (.,\"\"\") ]/text()
标签: python xml xpath scrapy lxml