【问题标题】:Scrapy / XPATH : finding substring in image urlScrapy / XPATH:在图像 url 中查找子字符串
【发布时间】:2018-01-18 18:26:19
【问题描述】:

我有以下 HTML 源代码模式:

<ul class="test_ul">
     <li>
         <img src="https://www.awebsite.com/image_1_a_test.png" />
    </li>  
    <li>
         <img src="https://www.awebsite.com/another_1_b_test.jpg" />
    </li>
</ul>

现在我希望能够仅选择 src 指向包含“b_test”子字符串的图像的路径。

这是我在 scapy 中作为选择器的字符串:

".//ul[@class='test_ul']//img[contains(@src,'b_test')]"

但这似乎不起作用,我没有看到错误。我可以检查全名,但不能检查子字符串。

非常感谢任何帮助。

【问题讨论】:

  • 不带前导.试试能行吗?
  • 不,恐怕没有,因为这只是循环中的嵌套项,我需要上下文。
  • 为了澄清,选择器可以正常工作到 ..//img 。如果我只是使用 ..//img/@src 之类的东西,它会正确返回源 url。
  • 你能展示一个可运行的例子来说明问题吗?无法重现,测试时获取元素。
  • @PeterK。您的上下文在每次迭代时都不会在循环中发生变化?

标签: xpath scrapy substring


【解决方案1】:

我认为您应该包含 /@src 以获取 url 路径

".//ul[@class='test_ul']//img[contains(@src,'b_test')]/@src"

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2015-12-03
    • 2012-04-02
    • 1970-01-01
    • 2018-12-17
    • 2011-07-13
    • 1970-01-01
    相关资源
    最近更新 更多