【问题标题】:How to select inner text of the link using XPath?如何使用 XPath 选择链接的内部文本?
【发布时间】:2016-09-30 05:04:10
【问题描述】:

我正在使用Scrapy 抓取数据。

在浏览器的JS 控制台上,我输入$x('//div[@class="summary"]//div[contains(@class, "tags")]') 以获取我需要的内容,但我需要过滤数据。

下图为$x('//div[@class="summary"]//div[contains(@class, "tags")]')命令结果。

我应该如何编写xpath命令来获取绿色框中的数据?我试过$x('//div[@class="summary"]//div[contains(@class, "tags")]//a[contains(@class, "post-tag")]'),但这不是我想要的。

谢谢!

【问题讨论】:

  • 你为什么跳过'python-2.7'?背后的逻辑是什么? (我认为这就是你所说的“不是我需要的”)
  • @har07,我需要获取正确的 xpath 脚本来过滤 JS 控制台中的数据。见xpath
  • @har07,对不起,我忘了在上面放一个盒子。谢谢!!!

标签: javascript css xpath scrapy href


【解决方案1】:

要在选定的div 中选择<a> 元素的内部文本,您只需要将/a/text() 附加到选择div 的XPath 中:

//div[@class="summary"]//div[contains(@class, "tags")]/a/text()

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2016-11-13
    • 1970-01-01
    • 2014-03-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-01-13
    相关资源
    最近更新 更多