【问题标题】:Scrape without tag in <a><a> 中不带标签的刮擦
【发布时间】:2021-09-29 10:19:27
【问题描述】:

我正在尝试用 python 抓取一个网站,但我在标签中没有类或 id 的文本有问题

<div class="d-inline"> <img class="team-img" src="https://cdn.fifacm.com/content/media/imgs/fifa22/teams/52/l73.png?v=10"> <a href="/22/team/73/paris-saint-germain"> Paris Saint-Germain </a> </div>

我需要提取“巴黎圣日耳曼”

我该怎么办?

谢谢 再见

【问题讨论】:

    标签: python web-scraping


    【解决方案1】:

    解决办法如下:

    代码:

    from bs4 import BeautifulSoup
    
    tag = """
    <div class="d-inline">
     <img class="team-img" src="https://cdn.fifacm.com/content/media/imgs/fifa22/teams/52/l73.png?v=10"/>
     <a href="/22/team/73/paris-saint-germain">
      Paris Saint-Germain
     </a>
    </div>
    
    """
    
    soup = BeautifulSoup(tag, 'html.parser')
    
    
    tag= soup.select_one('div.d-inline')
    print(tag.text)
    

    输出:

    Paris Saint-Germain
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-01-02
      • 1970-01-01
      • 2020-01-09
      • 2021-09-06
      • 2014-08-10
      相关资源
      最近更新 更多