【问题标题】:lxml - how to get xpath of HtmlElement?lxml - 如何获取 HtmlElement 的 xpath?
【发布时间】:2014-12-05 22:20:00
【问题描述】:

使用 XML etree,可以做到:

etree.getpath(element

我将如何做同样的事情,但使用 HTML 而不是 XML?

【问题讨论】:

    标签: python html xml xpath lxml


    【解决方案1】:

    _ElementTree 有一个getpath 方法:

    In [17]: import lxml.html as LH
    In [18]: content = '<root><div id="pgbrk" ......>....Page Break....</div></root>'
    
    In [19]: root = LH.fromstring(content)
    
    In [20]: tree = root.getroottree()
    
    In [21]: tree.getpath(root[0])
    Out[21]: '/html/body/root/div'
    

    【讨论】:

    • 大声救命。我自己实现了这个功能。
    猜你喜欢
    • 2012-09-29
    • 2014-08-16
    • 2021-12-24
    • 2014-01-11
    • 1970-01-01
    • 1970-01-01
    • 2021-01-26
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多