【发布时间】:2017-12-04 12:36:29
【问题描述】:
我想用单引号替换所有出现的双引号。 但只在img标签中!我有一个html文本
<p>First p</p><img class="image" src="one.jpg" />
<p>Second p</p><img class="image" src="two.jpg" />
我怎样才能替换这个“就地”。 我尝试过这样的事情:
re.sub('"', "'", re.findall(r'<img.*/>', html))
预期的结果是这样的:
<p>First p</p><img class='image' src='one.jpg' />
<p>Second p</p><img class='image' src='two.jpg' />
【问题讨论】:
-
预期输出是什么?
-
假设html标签是
str类型,可以使用s.replace("\"", "\'")) -
You can't parse HTML with regex。使用真正的 HTML 解析器。