【发布时间】:2011-01-08 00:01:25
【问题描述】:
如果 XML 有多个顶级项,我如何使用 Python ElementTree 读取 XML 文件?
我有一个想要使用 Python ElementTree 读取的 XML 文件。
不幸的是,它有多个顶级标签。我会将<doc>...</doc> 包裹在XML 周围,除非我必须将<doc> 放在 <?xml> 和<!DOCTYPE> 字段之后。但是弄清楚<!DOCTYPE> 的结束位置并非易事。
我有什么:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE FOO BAR "foo.dtd" [
<!ENTITY ...>
<!ENTITY ...>
<!ENTITY ...>
]>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
我想要什么:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE FOO BAR "foo.dtd" [
<!ENTITY ...>
<!ENTITY ...>
<!ENTITY ...>
]>
<DOC>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
</DOC>
注意,标签 ARTICLE 的名称可能会改变,所以我无法 grep。
谁能向我建议如何在 XML 标头之后添加封闭的 <doc>...</doc>,或者建议另一种解决方法?
【问题讨论】:
标签: python xml parsing elementtree