【发布时间】:2011-06-04 05:20:00
【问题描述】:
我的问题与:Strip HTML from strings in Python
我正在寻找一种从文本中去除 HTML 代码的简单方法。例如:
string = 'foo <SOME_VALID_HTML_TAG> something </SOME_VALID_HTML_TAG> bar'
stripIt(string)
然后会产生foo bar。
是否有任何简单的工具可以在 Python 中实现这一点? HTML 代码可以嵌套。
【问题讨论】:
-
我认为您可能希望在您链接的问题上使用已接受的答案 - 您正在做的事情有何不同?
-
在相关问题中,用户希望 stripIt('
foo ') 产生 foo,而在我的情况下,我希望它返回 ''。 -
正确 - 我的错误。我没有看到对您问题的修改,并认为
something是您想要删除的标签。 -
“SOME_VALID_HTML_TAG”是否设置为特定标签?是否要删除最外层的标签?