【发布时间】:2019-02-11 19:27:08
【问题描述】:
我正在使用 BeautifulSoup 从网站上抓取角色信息。 BeautifulSoup 在尝试获取角色的胜率时,找不到。
当我检查文本时,它列在 .我在网站源代码中能找到的所有内容,以及 BeautifulSoup 找到的所有内容都是“ranking-stats-placeholder”。
这是我目前正在使用的代码。
import bs4
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
my_url = "https://u.gg/lol/champions/darius/build/?role=top"
#opening up connection, grabbing the page
uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()
#html parsing
page_soup = soup(page_html, "html.parser")
#champion name
champ_name = page_soup.findAll("span", {"class":"champion-name"})[0].text
#champion win rate
champ_wr = page.soup.findAll("div", {"class":"win-rate okay-tier"})
我相信获胜率文本是由 javascript 添加的,但我不知道如何获取文本。我目前拥有的代码为 champ_wr 返回“无”
【问题讨论】:
标签: javascript python web-scraping beautifulsoup