【发布时间】:2012-05-16 12:00:45
【问题描述】:
假设我有一个带有<p> 和<br> 标记的HTML。之后,我将剥离 HTML 以清理标签。如何将它们变成换行符?
如果有帮助的话,我正在使用 Python 的 BeautifulSoup 库。
【问题讨论】:
-
对如何完成有任何偏好吗?我打算建议
re.sub(r"<p>|<br>", "\n", myString) -
那么结束标签呢?
-
</?p>|<br>我猜。你只想要一个换行符在结束标记之后? -
我会跳过 Beautiful Soup,直接通过 XSLT 来代替。