如何排除总跨度标签，即我只想排除此 p 标签跨度标签内的 p 标签中的文本

【问题标题】：How to exclude total span tag i.e i want only text in p tag inside of this p tag span tag should be excluded如何排除总跨度标签，即我只想排除此 p 标签跨度标签内的 p 标签中的文本
【发布时间】：2019-10-22 21:49:12
【问题描述】：

我需要使用scrapy代码在p标签内排除span标签内的文本。

我附上图片中的html路径，请找到并帮助我。

response.xpath('//*[@id="post-55812"]/div/p').not(span::text).extract()

错误：

  File "<console>", line 1
    response.xpath('//*[@id="post-55812"]/div/p').not(span::text).extract()[1:11]))
                                                    ^
SyntaxError: invalid syntax

【问题讨论】：

请参阅stackoverflow.com/help/how-to-ask

标签： python xpath web-scraping scrapy web-crawler

【解决方案1】：

这应该可以工作

response.css('#post-55812 > div > p:not(span)').extract()

【讨论】：

ValueError: XPath error: Invalid expression in //*[@id="post-55812"]/div/p/[not(self::span)] 抱歉，这是当在@Umair 上方运行
response.css('#post-55812 > div > p:not(span)').extract()[1] u'
1.哪个是 power(x^y) 的正确运算符？
\na) X^y
\nb) X**y
\nc) X^^y
\nd) 没有提到
\n查看答案
' 仍然是跨度标签在那里@Umair
你只是在脱口而出标记。那有什么作用？它如何回答这个问题？解释你自己！ stackoverflow.com/help/how-to-answer