【发布时间】:2017-05-27 08:18:43
【问题描述】:
我在 Python 中使用 bs4 通过在通用标签中查找特定文本来抓取 Web 内容。具体来说:
html
...
<h3>Content</h3>
<ul>...</ul>
...
那么,无论如何,我是否可以指示 bs4 查找带有特定文本“内容”的标题,以便我可以识别锚点并获取内容?
我试过了,但是没用:
soup2.find('h3', {'text': 'Content'}).findNext('ul').text)
非常感谢。
【问题讨论】:
标签: python web-scraping beautifulsoup python-3.5