【发布时间】:2013-07-01 20:12:51
【问题描述】:
此 XML 文档包含一组标签 events-data。我想从最近的events-data 中提取信息。例如,在下面的代码中,我想去 last events-data 标记,去event-date 标记并提取date 子标记的文本。目前我在 Python 中使用 BeautifulSoup 来遍历这个文档。有什么想法吗?
<?xml version="1.0" encoding="UTF-8"?>
<first-tag>
<second-tag>
<events-data>
<event-date>
<date>20040913</date>
</event-date>
</events-data>
<events-data> #the one i want to traverse to grab date text
<event-date>
<date>20040913</date>
</event-date>
</events-data>
</second-tag>
</first-tag>
【问题讨论】:
-
我在想,就像在
elementtree或minidom中,您可以根据索引和长度遍历标签,但我想不出一种语法(或为此找到一个)为 BeautifulSoup 工作。请记住,我对 beautifulsoup 还是很陌生。 -
它必须以某种方式计算
events-data出现的次数,可能是numEvents = len(soup.find('events-data')),然后读取该索引处的子标签?
标签: python xml beautifulsoup