【发布时间】:2015-08-20 15:10:25
【问题描述】:
我在这里问了一个类似的问题,
但它只让我到目前为止。
我需要获取链接,并且我了解Scrapy 需要验证 HTML。这是 HTML
class="shopthepost-widget" data-widget-id="708473" data-widget-uid="1"><div id="stp-55d44feabd0eb" class="stp-outer stp-no-controls ">
<a class="stp-control stp-left stp-hidden"><</a>
<div class="stp-inner">
<div class="stp-slide" style="left: -0%">
<a href="http://rstyle.me/iA-n/zzhv34c_" target="_blank" rel="nofollow" class="stp-product " data-index="0">
<span class="stp-help"></span>
<img src="//images.rewardstyle.com/img?v=2.13&p=n_24878713">
</a>
<a href="http://rstyle.me/iA-n/zzhvw4c_" target="_blank" rel="nofollow" class="stp-product " data-index="1">
<span class="stp-help"></span>
<img src="//images.rewardstyle.com/img?v=2.13&p=n_24878708">
</a>
所以我尝试了
for widget in response.xpath("//div[@class='shopthepost-widget']"):
print response.xpath('.//*[@class="shopthepost-widget"]//a/@href').extract()
这不会产生任何回报,但如果我将 href 替换为 text(),那么它会产生 HTML 中的所有属性。这不是我需要的。我只想要链接,我需要将它们传递给一个项目。
这让我完全被难住了。所有的帮助都会得到近乎无限的感谢。
【问题讨论】:
-
这里没有javascript..我看到的只是html和python。
-
不要发布重复的问题,这些问题只是对原始问题的小更新。重复的问题会在多个帖子中分散有关某个主题的答案和信息,使其他人更难找到答案,并浪费人们时间重新提供您已经提供的答案。
标签: html xpath web-scraping scrapy scrapy-spider