【发布时间】:2019-01-29 03:04:54
【问题描述】:
我要抓取的网站如下所示:
<div align="center" class="movietable">
<span style="width:45px;height:47px;vertical-align:middle;display:table-cell;">
<a href="browse.php?cat=19"><img border="0" src="styles/images/cat/hd.png" alt="HdO"></a>
</span>
</div>
<div align="left" class="movietable">
<span style="padding:0px 5px;width:455px;height:47px;vertical-align:middle;display:table-cell;">
<a data-toggle="tooltip" data-placement="bottom" data-html="true" title="" href="details.php?id=578197" data-original-title="<img src='https://trasd.tmdb.org//tqistSlQGQVlvDZHweD.jpg'>">
<b>GET THIS TEXT</b></a><br><font class="small">[Action, Horror, Sci-Fi]</font>
</span>
</div>
如何提取:
-
<b>标记中的文本 - 在本例中为GET THIS TEXT font_class= 'small' 的内容 - 在本例中为
Action, Horror, Sci-Fi
.movietable b 效果很好!!img_scr 链接 - 在本例中为
https://trasd.tmdb.org//tqistSlQGQVlvDZHweD.jpg
我不知道该怎么做
【问题讨论】:
-
请分享您的代码 sn-p 以了解您迄今为止尝试过的内容以及遇到的任何异常情况。
标签: python selenium web-scraping automation