【问题标题】:Parsing CDATA in xml with python用python解析xml中的CDATA
【发布时间】:2012-12-04 00:21:02
【问题描述】:

我需要解析一个包含多个 CDATA 块的 XML 文件,我需要保留这些块以供以后绘制:

<process id="process1"> <log name="name1" device="device1"><![CDATA[timestamp value]]]></log> <log name="name2" device="device2"><![CDATA[timestamp value, timestamp value, timestamp]]]></log> </process>

我需要反复快速地执行此操作,并且我正在寻找执行此操作的最佳方法。我读过 ElementTree 是更快的方法,但我愿意接受其他建议。

【问题讨论】:

  • xtree 比元素树更好地解决您的问题。

标签: python xml parsing lxml


【解决方案1】:

这里有两个例子说明如何做到这一点:

from lxml import etree
import xml.etree.ElementTree as ElementTree

CONTENT = """
<process id="process1">
 <log name="name1" device="device1"><![CDATA[timestamp value]]></log>
 <log name="name2" device="device2"><![CDATA[timestamp value, timestamp value, timestamp]]></log>
</process>
"""

def parse_with_lxml():
    root = etree.fromstring(CONTENT)
    for log in root.xpath("//log"):
        print log.text

def parse_with_stdlib():
    root = ElementTree.fromstring(CONTENT)
    for log in root.iter('log'):
        print log.text

if __name__ == '__main__':
    parse_with_lxml()
    parse_with_stdlib()

输出:

timestamp value
timestamp value, timestamp value, timestamp
timestamp value
timestamp value, timestamp value, timestamp

它在这两种情况下处理它的文本属性。

【讨论】:

  • 为了性能,可以使用cElementTree(注意:leadind c
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-12-15
  • 1970-01-01
  • 2012-09-11
  • 2011-07-06
  • 1970-01-01
相关资源
最近更新 更多