【问题标题】:xpath could not recognize a tagxpath 无法识别标签
【发布时间】:2018-06-18 21:20:00
【问题描述】:

我正在尝试使用 xpath 从论坛中抓取 reddit 帖子。 我希望蜘蛛实现的功能之一是从当前页面完成抓取后立即自动转到下一页。 页面html代码如下:

<span class="next-button"><a href="https://www.reddit.com/r/InteriorDesign/?count=975&after=t3_8ol7yp" rel="nofollow next" >next ›</a></span>

我将 xpath 选择器用作: response.xpath("//a[@class= 'next-button']") 但它没有给我任何回报。有人可以帮我弄清楚原因吗?

谢谢! 豪

【问题讨论】:

    标签: javascript html xpath web-scraping scrapy


    【解决方案1】:

    @class 属性位于 span 元素上,而不是 a 链接元素上。因此,将您的 XPath 更改为

    response.xpath("//span[@class = 'next-button']/a")
    

    选择a

    response.xpath("//span[@class = 'next-button']/a/@href")
    

    获取链接地址。

    【讨论】:

    • 您好,我使用了您的表达方式。感谢您的回复。但是它仍然给我空的结果,不知道为什么......
    • 鉴于您在问题中发布的内容,此答案很好。如果它不适合您,请发布更多详细信息以获得进一步的帮助。
    猜你喜欢
    • 2022-01-05
    • 2013-05-08
    • 2017-11-04
    • 1970-01-01
    • 2015-12-26
    • 2021-12-08
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多