【发布时间】:2023-02-21 20:53:29
【问题描述】:
我正在尝试使用 etree 解析 XML 文件,使用
tree = etree.parse(path_to_xml)
给我一个错误:
lxml.etree.XMLSyntaxError : CData secton too big found.
所以我试图删除所有 CData 标签,但为了阅读它,我需要解析,这样解决方案就毫无意义了。
删除 CData 标签就可以了,我试过为此使用正则表达式,但这是一个有风险的修复。
此外,我无法共享该文件,因为它是机密文件,但因为我已经与我的同事交谈过,可能是由于 CData 长度导致的错误。 XML 文件大约 30MB,所以它与内存无关,知道吗?谢谢!!
【问题讨论】:
标签: python python-3.x xml lxml cdata