【问题标题】:Python: exclude outer wrapping element when getting content via css/xpath selectorPython:通过 css/xpath 选择器获取内容时排除外包装元素
【发布时间】:2022-07-27 16:36:27
【问题描述】:

我使用这段代码来获取元素div.entry-content的内容:

item['description'] = response.css('div.entry-content').get()

但是,它也返回包装元素:

<div class="entry-content">
    <p>**my content**</p>
</div>

但我只想要内容,所以就我而言:&lt;p&gt;**my content**&lt;/p&gt;

我还尝试了 xpath 选择器response.xpath('//div[@class="entry-content"]').get(),但结果与上述相同。 我试过谷歌搜索,但找不到任何东西。

【问题讨论】:

    标签: python web-scraping


    【解决方案1】:

    您的内容在&lt;p&gt; 标签中,而不是&lt;div&gt;

    response.css('div.entry-content p').get()
    

    【讨论】:

      猜你喜欢
      • 2015-04-02
      • 1970-01-01
      • 2021-11-21
      • 1970-01-01
      • 2015-10-15
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-12-25
      相关资源
      最近更新 更多