【发布时间】:2011-04-13 14:52:18
【问题描述】:
我需要解析一个包含各种 XML 文件的文件,即
lxml.etree.XMLSyntaxError: XML declaration allowed only at the start of the document
现在,我可以预处理输入文件并为每个包含的 XML 文件生成一个单独的文件。这可能是最简单的解决方案。但我想知道这个“问题”是否存在适当的解决方案。
谢谢!
【问题讨论】:
-
+1,我也遇到了同样的问题。您建议的解决方法是实现一个完整的 XML 解析器/扫描器,这超出了 lxml 的目的。
-
@larsmans:具有多个根元素的文件不是 XML 文档。不管你喜不喜欢,但不要怪 lxml。
-
@mzjn:我知道,但我每天都会遇到单个文件(或嵌入其他文件中的 XML)中的 XML 文档流。我不怪 lxml,但我会发现它是 XML 库能够处理它的一个很棒的特性。也许lxml可以做到,但我还没有找到它的开关。
标签: python xml lxml elementtree