【发布时间】:2016-08-14 14:31:09
【问题描述】:
我需要解析 HTML 代码并在 <a> 标记中找到所有出现的 <img> 标记,以替换 <a> 标记中的某些内容。
比方说,我想找到
<a ...><img src="path/to/image" /></a>
<a> 标签可以包含不同的属性,我需要替换的是:
<a<a class="something"
解析是在 Python 中完成的,但我认为,我需要使用正则表达式。
但是,我对正则表达式很陌生,所以我想知道如何做到这一点。
【问题讨论】:
-
使用 BeautifulSoup 或任何其他解析器。不要使用正则表达式解析
HTML -
关于用Regex解析HTML:*.com/a/1732454/1771634
-
非常感谢。这看起来非常好,易于使用且速度快......
标签: regex html-parsing