【发布时间】:2011-05-08 11:02:13
【问题描述】:
来自像这样的 html/rss sn-p
[...]<div class="..." style="..."></div><p><a href="..."
<img alt="" heightt="" src="http://link.to/image"
width="" /></a><span style="">[...]
我想获取图片 src 链接“http://link.to/image.jpg”。我怎样才能在python中做到这一点?谢谢。
【问题讨论】:
-
是 HTML 还是 RSS?这是一个重要的区别。正确的答案是使用正确的解析器,我相信 Python 有这些。
-
可以使用 RSS 我应该使用解析器,但如果是 html 怎么办?
-
如果是 RSS,您应该使用 RSS 解析器(可能后面跟着一个 HTML 解析器,您可以提取 HTML)。对于 HTML,您应该使用 HTML 解析器。