【发布时间】:2018-09-06 06:11:42
【问题描述】:
我有以下 HTML:
<div class="description">Item 1<br>Item 2<br></div>
我使用 BeautifulSoup 获取description 类中的内容:
descriptionItems = container.find('div', attrs={'class': 'description'}).text.strip()
我得到的是Item 1Item 2
我如何获得Item 1<br>Item 2<br>,即div标签之间的内容,包括br标签?
【问题讨论】:
-
单独
descriptionItems = container.find('div', attrs={'class': 'description'})有效吗? -
确实如此,但我得到了完整的标签,没有任何内容被剥离:
<div class="description">Item 1<br>Item 2<br></div>,
标签: python beautifulsoup web-crawler screen-scraping extraction