【发布时间】:2017-12-01 06:33:30
【问题描述】:
response.xpath('//*[@id="blah"]//text()')
假设我的 html 是
<p id="blah">This is a simple text <a href="#">foo</a> and this is after tag. </p>
发生了什么我得到了一个文本列表,即使它有一个<p> 标签。比如
[u'This is a simple text', u' and this is after tag.']
我的实际 html 内容非常庞大,我必须这样做 join 才能实现这一点。我也输了foo 而join。有没有具体的xpathscrapy 机制来做到这一点?
我想得到结果 这是一个简单的文本 foo,这是在标记之后。
请注意这里的foo。
谢谢
【问题讨论】:
-
也适用于xpath?