【发布时间】:2019-05-20 05:45:45
【问题描述】:
我有一个自定义命名空间的 XML 文档:
<parent>
<c1:doc>
<c1:attr_a></c1:attr_a>
<c1:attr_b></c1:attr_b>
</c1:doc>
<c2:doc>
<c2:attr_a></c2:attr_a>
<c2:attr_b></c2:attr_b>
</c2:doc>
</parent>
是否可以在 Python 的 BeautifulSoup 中查询此文档中所有 attr_a 属性的值?
我可以用原始字符串操作遍历树或以非常繁琐的方式遍历父级的子级,但是是否可以更直接地查询soup.find_all('*.attr_a') 或类似的?任何建议将不胜感激。
【问题讨论】:
-
这种关系是否保持不变,即父母中孩子的第一个孩子?
-
@QHarr 可惜关系不稳定
-
你已经得到我的下一个建议 +
标签: python xml parsing beautifulsoup namespaces