【发布时间】:2016-03-29 18:18:02
【问题描述】:
我在python脚本中有一行代码如下所示
for summaries in soup.findAll('div',{'class':'cb-lv-scrs-col cb-font-12 cb-text-complete'}):
#do something with summaries
但是,我希望摘要还包括来自 div 的项目以及另一个名为 cb-scag-mtch-status cb-text-inprogress 的类
我已经尝试过这里给出的以下 - BeautifulSoup findAll() given multiple classes?
for summaries in soup.findAll('div',{'class':['cb-lv-scrs-col cb-font-12 cb-text-complete','cb-scag-mtch-status cb-text-inprogress']}):
#do something with summaries
但这不起作用。有什么问题,我该如何解决?
【问题讨论】:
-
每个类之间的空格表示多个类,因此在第一行中搜索类
cb-lv-scrs-col、cb-font-12和cb-text-complete。 -
我不这么认为。在源代码中,它被赋予了 class="cb-lv-scrs-col cb-font-12 cb-text-complete" 所以我认为它的意思是整个类。
-
我尝试了上面我的问题中提到的那个问题中提到的解决方案。它没有用。
-
正则表达式解决方案怎么样?如果它不起作用也没关系,这仍然是一个重复的问题,应该关闭。
-
我不喜欢使用正则表达式,因为这是我编写程序的主要目的。在不使用正则表达式的情况下抓取网页。
标签: python beautifulsoup