【发布时间】:2019-09-20 03:38:19
【问题描述】:
我在使用其包含在以下页面上的文本查找标签时遇到了麻烦: Link to web page
我正在尝试使用以下代码查找彭博和路透社代码。 我尝试使用 cssSelector:
css_selector = 'tr:has(> td:contains("Bloomberg Code"))'
my_tag: Tag = my_soup.select_one(css_selector)
使用我试过的 find:
my_tag = my_soup.find(lambda t: t.Tag == 'td' and re.findall('Bloomberg Code', t.text, flags=re.I))
它们都返回了大量的 Html 代码,这些代码确实以标签“tr”开头,但与我期望的不匹配:
<tr>
<td style="padding-top:5px">- Bloomberg Code : </td>
<td style="padding-left:10px;padding-top:5px" align="left"> FLTR:ID</td>
</tr>
我认为问题可能在于 Beautifulsoup 将其视为可导航字符串,但是当我检查为 my_tag 找到的结果类型时,它显示:class 'bs4.element.Tag'
感谢您的帮助 最好的
【问题讨论】:
标签: python web-scraping beautifulsoup css-selectors