【发布时间】:2012-10-17 01:59:32
【问题描述】:
我想以可区分的方式打印出 etree(由 html 文档形成)的树结构(意味着两个 etree 应该以不同的方式打印出来)。
我所说的结构是树的“形状”,基本上是指所有的标签,但没有属性,也没有文本内容。
有什么想法吗? lxml 中有什么东西可以做到这一点吗?
如果不是,我想我必须遍历整个树并从中构造一个字符串。知道如何以紧凑的方式表示树吗? (“紧凑”功能不太相关)
仅供参考,它不是用来查看的,而是用来存储和散列的,以便能够在几个 html 模板之间产生差异。
谢谢
【问题讨论】:
-
.tostring()方法有什么不适合你的吗? -
是的,很抱歉,如果不清楚:我所说的树结构基本上只是标签,没有文本,也没有属性(有问题添加)
-
我不认为 LXML 内置了这个功能,所以你必须走树。