【发布时间】:2010-10-18 08:02:13
【问题描述】:
我有一个这样的html文本:
<xml ... >
我想把它转换成可读的东西:
<xml ...>
在 Python 中有什么简单(快速)的方法吗?
【问题讨论】:
-
我认为这个问题与此重复:stackoverflow.com/questions/57708/…
标签: python html-entities python-2.6
我有一个这样的html文本:
<xml ... >
我想把它转换成可读的东西:
<xml ...>
在 Python 中有什么简单(快速)的方法吗?
【问题讨论】:
标签: python html-entities python-2.6
HTMLParser 的官方文档:Python 3
>>> from html import unescape
>>> unescape('© €')
© €
HTMLParser的官方文档:Python 3
>>> from html.parser import HTMLParser
>>> pars = HTMLParser()
>>> pars.unescape('© €')
© €
注意:这已被 html.unescape() 弃用。
HTMLParser的官方文档:Python 2.7
>>> import HTMLParser
>>> pars = HTMLParser.HTMLParser()
>>> pars.unescape('© €')
u'\xa9 \u20ac'
>>> print _
© €
【讨论】:
现代 Python 3 方法:
>>> import html
>>> html.unescape('© €')
© €
【讨论】:
正如 Fred 指出的帖子所链接的那样,有一个函数 here 可以做到这一点。复制到这里是为了让事情变得更容易。
感谢 Fred Larson 链接到关于 SO 的另一个问题。 感谢 dF 发布链接。
【讨论】: