【发布时间】:2013-01-28 23:32:27
【问题描述】:
我有以下 XML 想要使用 Python 的 ElementTree 解析:
<rdf:RDF xml:base="http://dbpedia.org/ontology/"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:owl="http://www.w3.org/2002/07/owl#"
xmlns:xsd="http://www.w3.org/2001/XMLSchema#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns="http://dbpedia.org/ontology/">
<owl:Class rdf:about="http://dbpedia.org/ontology/BasketballLeague">
<rdfs:label xml:lang="en">basketball league</rdfs:label>
<rdfs:comment xml:lang="en">
a group of sports teams that compete against each other
in Basketball
</rdfs:comment>
</owl:Class>
</rdf:RDF>
我想找到所有owl:Class 标签,然后提取其中所有rdfs:label 实例的值。我正在使用以下代码:
tree = ET.parse("filename")
root = tree.getroot()
root.findall('owl:Class')
由于命名空间,我收到以下错误。
SyntaxError: prefix 'owl' not found in prefix map
我尝试阅读http://effbot.org/zone/element-namespaces.htm 的文档,但由于上述 XML 有多个嵌套命名空间,我仍然无法正常工作。
请告诉我如何更改代码以找到所有owl:Class 标签。
【问题讨论】:
-
从 Python 3.8 开始,命名空间通配符可以与
find()、findall()和findtext()一起使用。见stackoverflow.com/a/62117710/407651。
标签: python xml xml-parsing xml-namespaces elementtree