【发布时间】:2013-09-14 13:36:24
【问题描述】:
我想从网站上抓取项目列表,并保留它们的显示顺序。这些项目被组织在一个表格中,但它们可以是两个不同类别之一(以随机顺序)。
有没有办法提供多个类并让 BeautifulSoup4 找到任何给定类中的所有项目?
我需要实现这段代码的功能,除了保留源代码中的项目顺序:
items = soup.findAll(True,{'class':'class1'})
items += soup.findAll(True,{'class':'class2'})
【问题讨论】:
-
感谢 alecxe 和 Roman Pekar 帮助我解决了这个问题。我能够使用部分类名和alecxe更新答案中建议的额外检查来实现我想要的。
标签: python html beautifulsoup html-parsing