【发布时间】:2020-10-25 11:31:50
【问题描述】:
我需要从具有这些属性的以下标记中获取内容:<span class="h6 m-0">。
我将遇到的 HTML 示例是 <span class="h6 m-0">Hello world</span>,它显然需要返回 Hello world。
我目前的代码如下:
page = BeautifulSoup(text, 'html.parser')
names = [item["class"] for item in page.find_all('span')]
这很好用,可以让我获得页面中的所有跨度,但我不知道如何指定我只想要具有特定类 "h6 m-0" 的那些并获取里面的内容。我将如何去做?
【问题讨论】:
-
print([span.text for span in page.select('span.h6.m-0')])?
标签: python html css web-scraping beautifulsoup