【发布时间】:2017-12-20 18:10:17
【问题描述】:
我有一个 html 字符串,我正在尝试替换段落标记。我可以通过选择编辑 > 查找内容:^p > 替换为 ^s > 全部替换,在 word 中手动执行此操作。我的问题是如何在 python 中使用 html 字符串来做到这一点?
sample_html_string = "<html>
<title>
Hello
</title>
</html>"
correct_html_string = "<html><title>Hello</title></html>"
这个问题不是简单地使用re.sub 解决的,因为我有一个更复杂的 html 字符串,其中包含li 标记和p 标记,我想在其中保留格式。
【问题讨论】:
-
您的示例不包含任何看起来像“段落标记”的内容,结果也不包含任何不间断空格。您只是想删除空格吗?