【发布时间】:2019-01-15 14:45:42
【问题描述】:
<root>
<article>
<front>
<body>
<back>
<sec id="sec7" sec-type="funding">
<title>Funding</title>
<p>This work was supported by the NIH</p>
</sec>
</back>
我有一个科学期刊元数据的 XML 文件,我正在尝试仅提取每篇文章的资助信息。我需要p 标签中包含的信息。虽然“sec id”因文章而异,但“sec-type”始终是“funding”。
我一直在尝试使用元素树在 Python3 中执行此操作。
import xml.etree.ElementTree as ET
tree = ET.parse(journals.xml)
root = tree.getroot()
for title in root.iter("title"):
ET.dump(title)
任何帮助将不胜感激!
【问题讨论】:
-
你能举一个完整的有效 XML 的例子吗?