【问题标题】:Parsing xml tree attributes (file has no elements)解析 xml 树属性(文件没有元素)
【发布时间】:2016-10-17 19:29:15
【问题描述】:

我一直在尝试使用 minidom,但没有真正的偏好。由于某种原因,lxml 不会安装在我的机器上。

我想解析一个xml文件:

<?xml version="1.
    -<transfer frmt="1" vtl="0" serial_number="E5XX-0822" date="2016-10-03 16:34:53.000" style="startstop">
        -<plateInfo>
              <plate barcode="E0122326" name="384plate" type="source"/>
              <plate barcode="A1234516" name="1536plateD" type="destination"/>
        </plateInfo>
        -<printmap total="1387">
            <w reason="" cf="13" aa="1.779" eo="299.798" tof="32.357" sv="1565.311" ct="1.627" ft="1.649" fc="88.226" memt="0.877" fldu="Percent" fld="DMSO" dy="0" dx="0" region="-1" tz="18989.481" gy="72468.649" gx="55070.768" avt="50" vt="50" vl="3.68" cvl="3.63" t="16:30:47.703" dc="0" dr="0" dn="A1" c="0" r="0" n="A1"/>
            <w reason="" cf="13" aa="1.779" eo="299.798" tof="32.357" sv="1565.311" ct="1.627" ft="1.649" fc="88.226" memt="0.877" fldu="Percent" fld="DMSO" dy="0" dx="0" region="-1" tz="18989.481" gy="72468.649" gx="55070.768" avt="50" vt="50" vl="3.68" cvl="3.63" t="16:30:47.703" dc="0" dr="0" dn="A1" c="1" r="0" n="A2"/>
        </printmap>
    </transfer>

如您所见,这些文件没有任何元素详细信息。所有信息都包含在属性中。在尝试改编另一个 SO 帖子时,我有这个 - 但它似乎更适合元素。我也未能找到“浏览”xml 信息的好方法,即我想说“dir(xml_file)”并列出我可以在树结构上执行的所有方法,或查看所有属性.我知道这是很多而且可能不同的方向,但提前谢谢你!

def parse(files):
    for xml_file in files:
        xmldoc = minidom.parse(xml_file)
        transfer = xmldoc.getElementsByTagName('transfer')[0]
        plateInfo = transfer.getElementsByTagName('plateInfo')[0]

【问题讨论】:

标签: python xml minidom


【解决方案1】:

使用 minidom,您可以使用方法属性访问特定元素的属性,然后将其视为字典;此示例迭代并打印元素 transfer[0] 的属性:

from xml.dom.minidom import parse, parseString
xml_file='''<?xml version="1.0" encoding="UTF-8"?>
    <transfer frmt="1" vtl="0" serial_number="E5XX-0822" date="2016-10-03 16:34:53.000" style="startstop">
        <plateInfo>
              <plate barcode="E0122326" name="384plate" type="source"/>
              <plate barcode="A1234516" name="1536plateD" type="destination"/>
        </plateInfo>
        <printmap total="1387">
            <w reason="" cf="13" aa="1.779" eo="299.798" tof="32.357" sv="1565.311" ct="1.627" ft="1.649" fc="88.226" memt="0.877" fldu="Percent" fld="DMSO" dy="0" dx="0" region="-1" tz="18989.481" gy="72468.649" gx="55070.768" avt="50" vt="50" vl="3.68" cvl="3.63" t="16:30:47.703" dc="0" dr="0" dn="A1" c="0" r="0" n="A1"/>
            <w reason="" cf="13" aa="1.779" eo="299.798" tof="32.357" sv="1565.311" ct="1.627" ft="1.649" fc="88.226" memt="0.877" fldu="Percent" fld="DMSO" dy="0" dx="0" region="-1" tz="18989.481" gy="72468.649" gx="55070.768" avt="50" vt="50" vl="3.68" cvl="3.63" t="16:30:47.703" dc="0" dr="0" dn="A1" c="1" r="0" n="A2"/>
        </printmap>
    </transfer>'''
xmldoc = parseString(xml_file)
transfer = xmldoc.getElementsByTagName('transfer')
attlist= transfer[0].attributes.keys()
for a in attlist:
    print transfer[0].attributes[a].name,transfer[0].attributes[a].value

您可以在此处找到更多信息:

http://www.diveintopython.net/xml_processing/attributes.html

【讨论】:

    猜你喜欢
    • 2011-06-11
    • 1970-01-01
    • 1970-01-01
    • 2017-03-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多