【问题标题】:How to exclude total span tag i.e i want only text in p tag inside of this p tag span tag should be excluded如何排除总跨度标签,即我只想排除此 p 标签跨度标签内的 p 标签中的文本
【发布时间】:2019-10-22 21:49:12
【问题描述】:

我需要使用scrapy代码在p标签内排除span标签内的文本。

我附上图片中的html路径,请找到并帮助我。

response.xpath('//*[@id="post-55812"]/div/p').not(span::text).extract()

错误:

  File "<console>", line 1
    response.xpath('//*[@id="post-55812"]/div/p').not(span::text).extract()[1:11]))
                                                    ^
SyntaxError: invalid syntax

【问题讨论】:

标签: python xpath web-scraping scrapy web-crawler


【解决方案1】:

这应该可以工作

response.css('#post-55812 > div > p:not(span)').extract()

【讨论】:

  • ValueError: XPath error: Invalid expression in //*[@id="post-55812"]/div/p/[not(self::span)] 抱歉,这是当在@Umair 上方运行
  • response.css('#post-55812 > div > p:not(span)').extract()[1] u'

    1.哪个是 power(xy) 的正确运算符?
    \na) X^y
    \nb) X**y
    \nc) X^^y
    \nd) 没有提到
    \n查看答案

    ' 仍然是跨度标签在那里@Umair
  • 你只是在脱口而出标记。那有什么作用?它如何回答这个问题?解释你自己! stackoverflow.com/help/how-to-answer
猜你喜欢
  • 2021-09-07
  • 2014-10-02
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-11-06
相关资源
最近更新 更多