<a> 中不带标签的刮擦

【问题标题】：Scrape without tag in <a><a> 中不带标签的刮擦
【发布时间】：2021-09-29 10:19:27
【问题描述】：

我正在尝试用 python 抓取一个网站，但我在标签中没有类或 id 的文本有问题

<div class="d-inline"> <img class="team-img" src="https://cdn.fifacm.com/content/media/imgs/fifa22/teams/52/l73.png?v=10"> <a href="/22/team/73/paris-saint-germain"> Paris Saint-Germain </a> </div>

我需要提取“巴黎圣日耳曼”

我该怎么办？

谢谢再见

【问题讨论】：

标签： python web-scraping

【解决方案1】：

解决办法如下：

代码：

from bs4 import BeautifulSoup

tag = """
<div class="d-inline">
 <img class="team-img" src="https://cdn.fifacm.com/content/media/imgs/fifa22/teams/52/l73.png?v=10"/>
 <a href="/22/team/73/paris-saint-germain">
  Paris Saint-Germain
 </a>
</div>

"""

soup = BeautifulSoup(tag, 'html.parser')


tag= soup.select_one('div.d-inline')
print(tag.text)

输出：

Paris Saint-Germain

【讨论】：