【发布时间】:2021-10-26 16:15:41
【问题描述】:
这是我第三次或第四次使用 BeautifulSoup。我将它与请求库一起使用以从sports' website 中抓取数据。我正在尝试抓取运动员的信息,例如姓名、年龄、身高等。但是,在尝试获取信息时(打印(玩家名称)),我得到的是这个,而不是网站页面中显示的内容:
姓名:{{details.player.person.lastName}},{{details.player.person.firstName}}
有没有办法访问真实数据?
我的代码:
import requests
from bs4 import BeautifulSoup
def scrape_player(player_url):
response_player = requests.get(player_url)
player_soup = BeautifulSoup(response_player.text, 'html.parser')
div = player_soup.find('div', {'class' : 'player-info-row'})
player_name = div.text
print(player_name)
if __name__ == '__main__':
scrape_player('https://ehfcl.eurohandball.com/men/20212/player/LFpFsiLDFvxs_tXnKlFAQw/luis-frade/')
【问题讨论】:
-
嘿@Duarte Guerreiro 欢迎来到SO!请用代码编辑您的问题,以便于理解!
-
感谢您的欢迎信息。 @BhavyaParikh 我刚刚编辑了问题
-
我无法打开显示 404 的 URL!
标签: python beautifulsoup screen-scraping