【发布时间】:2014-07-16 11:26:52
【问题描述】:
我想解析一个相当大的类似 xml 的文件,它没有任何根元素。文件格式为:
<tag1>
<tag2>
</tag2>
</tag1>
<tag1>
<tag3/>
</tag1>
我尝试了什么:
- 尝试使用 ElementTree 但它返回“无根”错误。 (有没有其他的python库可以用来解析这个文件?)
- 尝试添加一个额外的标签来包装整个文件,然后使用 Element-Tree 对其进行解析。但是,我想使用一些更有效的方法,我不需要更改原始 xml 文件。
【问题讨论】:
-
文件有多大?
-
它包含超过 300 万个有用的术语(除了标签和其他不必要的数据)
-
大概的文件大小?您在寻找时间效率还是内存效率?可以将整个文件读入内存吗?
标签: python xml parsing python-2.7 elementtree