【发布时间】:2010-10-11 15:51:55
【问题描述】:
我目前正在使用 BeautifulSoup 重新格式化一些 HTML 页面,但遇到了一点问题。
我的问题是原来的 HTML 有这样的东西:
<li><p>stff</p></li>
和
<li><div><p>Stuff</p></div></li>
还有
<li><div><p><strong>stff</strong></p></div><li>
使用 BeautifulSoup 我希望消除 div 和 p 标签,如果它们存在,但保留 strong 标签。
我正在浏览精美的汤文档,但找不到任何内容。 想法?
谢谢。
【问题讨论】:
标签: python beautifulsoup