【发布时间】:2016-01-10 18:26:01
【问题描述】:
我正在尝试使用 Python 中的 BeautifulSoup 4,通过其随附的文本在网页中找到 <a> 标记。我使用了一个实数表达式,如下例所示:
>>> from bs4 import BeautifulSoup as BS
soup = BS('<a>lalala <del>10</del> lalala </a>')
soup1 = BS('<a>lalala 10 lalala </a>'
>>> soup.find_all('a', text=re.compile('lalala'))
[]
>>> soup1.find_all('a', text=re.compile('lalala'))
[<a>lalala 10 lalala </a>]
为什么嵌入的<del></del> 标记使我无法找到文本中包含它的<a> 标记?我该如何解决?
【问题讨论】:
-
提示:您在示例中忘记了
import re:)
标签: python regex beautifulsoup