【发布时间】:2018-08-03 16:47:51
【问题描述】:
我有这两种情况,我想使用正则表达式通过其文本搜索标签。
soup = BeautifulSoup("<B><A NAME="toc96446_13"></A>TEXT </B></P>", "html5lib")
soup.find('b', text=re.compile('TEXT'))
我认为这不起作用,因为其中实际上包含我的 TEXT 的标签。
另外我怎样才能找到只包含数字的标签?
soup = BeautifulSoup("<p>169</p>", "html5lib")
soup.find('p', text=re.compile(r'[0-9]{1,}'))
谢谢
【问题讨论】:
标签: python parsing beautifulsoup html-parsing