【发布时间】:2015-02-17 14:09:03
【问题描述】:
我已经在 Python 中查看了一些解决方案,包括 lxml、BeautifulSoup 和 Scrapy。
网址是:https://uk.eurosport.yahoo.com/football/players/hugo-lloris/
<div class="player-image soccer-jersey" id="yui_3_16_0_1_1418920336731_663">
<img src="https://s1.yimg.com/bt/api/res/1.2/tJcByeD1uUzpRu9blmsOZA-- /YXBwaWQ9eW5ld3M7Zmk9ZmlsbDtoPTE3MDtxPTc1O3c9MTgw/http://l.yimg.com/j/assets/i/us/sp/v/soccer/worldcup/players/374980.1.jpg" width="180" height="170" alt="H. Lloris" title="" class="photo" id="yui_3_16_0_1_1418920336731_664">
</div>
我们有一个 div 类“player-image football-jersey”,然后在里面有一个 img 类“photo”。
我想下载该图像(注意:我会继续下载几个)。我已经查看了 csselector 和 xpath (并不总是支持,例如后者使用 BeautifulSoup) - 但我似乎无法下载它,在示例中我'发现有人访问img的标签来获取URL的href,这里不是这样的。
【问题讨论】:
-
任何答案对您有帮助吗?这个社区通过提问者和回答者之间的双向反馈发挥作用。您应该投票或选择(单击绿色复选标记)任何对您有用的回复。
-
@MagentaNova 我没有投票的声誉,但我点击了无色勾号。干杯。
标签: python python-2.7 web web-scraping web-crawler