【发布时间】:2012-03-28 13:46:12
【问题描述】:
我有这样的文字:
text = """<div>
<h1>Title</h1>
<p>A long text........ </p>
<a href=""> a link </a>
</div>"""
使用纯 Python,没有外部模块我想要这个:
>>> print remove_tags(text)
Title A long text..... a link
我知道我可以使用 lxml.html.fromstring(text).text_content() 来做到这一点,但我需要在纯 Python 中使用 2.6+ 的内置或 std 库来实现相同的目标
我该怎么做?
【问题讨论】:
-
您不想使用外部模块的任何具体原因。?
-
没有权限在服务器上安装模块...
标签: python html xml string parsing