【发布时间】:2016-07-04 15:17:44
【问题描述】:
我是 XPath 的新手,我完全无法使用 lxml 解析一个简单的 wiki 样式的网页。
我有以下表达式:
"".join(tree.xpath('//*[@id="mw-content-text"]/div[1]/p//text()'))
它工作正常,但我需要排除类为“引用”的孩子并获得带有以下表达式的 lxml.etree.XPathEvalError:
"".join(tree.xpath('//*[@id="mw-content-text"]/div[1]/p//*[not(@class="reference")].text()'))
什么是正确的 XPath 表达式?在此先感谢:)
【问题讨论】:
标签: python xml xpath lxml wiki