【问题标题】:LXML to write in unicode?LXML 用 unicode 编写?
【发布时间】:2015-08-19 19:59:59
【问题描述】:

我目前正在使用 lxml 来编写文件。我构建节点,然后使用etree.tostring(node, pretty_print=True) 将其写入文件。不过好像是用htmlencoding--

<Synopsis>
    Abila schlie&#223;lich die ersten sechs Aufgaben zu meistern. Wird der Junge auch 
</Synopsis>

为了破译它并把它变成我想要的格式,我目前正在做:

>>> print HTMLParser.HTMLParser().unescape('Abila schlie&#223;lich die ersten sechs Aufgaben zu meistern. Wird der Junge auch')
Abila schließlich die ersten sechs Aufgaben zu meistern. Wird der Junge auch

我怎么会用 unicode 写这个,或者 lxml 不可能?

【问题讨论】:

    标签: python unicode lxml


    【解决方案1】:

    是的,您可以使用encoding 参数将编码传递给etree.tostring 方法:

    etree.tostring(node, pretty_print=True, encoding='unicode')
    

    来自etree.tostringdocs

    你也可以序列化为一个 Unicode 字符串而不用声明 将unicode 函数作为编码传递(或Py3 中的str),或 名称“unicode”。这会更改字节字符串的返回值 到一个未编码的 unicode 字符串。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2013-03-02
      • 1970-01-01
      • 2013-07-13
      • 1970-01-01
      • 1970-01-01
      • 2016-05-01
      • 2016-12-04
      • 1970-01-01
      相关资源
      最近更新 更多