【发布时间】:2014-01-26 10:36:09
【问题描述】:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
from bs4 import BeautifulSoup
import re
doc = "<div>Text text <span class='_ _3'>empty</span> text</div>"
soup = BeautifulSoup(doc)
for span in soup.find_all('span' , class_=re.compile("_\s_[0-9]+")) :
span.decompose()
需要找到所有带有<span class=_ _\d+> 的标签并从DOM 中删除。但是这段代码由于某种原因无法正常工作!
【问题讨论】:
标签: python regex beautifulsoup