【发布时间】:2018-10-30 16:31:37
【问题描述】:
我正在尝试从站点的“Div”multiCLass 中抓取文本:Concluded Cases with Details
The example of the "div" class
找不到div元素?
from bs4 import BeautifulSoup
from requests import get
url ="https://icsid.worldbank.org/en/Pages/cases/ConcludedCases.aspx?status=c"
response = get(url)
html_soup = BeautifulSoup(response.text, 'html.parser')
cases_containers = html_soup.find_all('div', class_ ="pendingcasescnts ng-scope")
print(len(cases_containers))
【问题讨论】:
-
ng-scope表示 Angular,它是一个 JavaScript 库。该 div 是否存在于HTML 本身中,还是在浏览器中创建? -
@Chris 我认为“div”存在于 html 本身中,您可以通过检查网站来验证:icsid.worldbank.org/en/Pages/cases/ConcludedCases.aspx?status=c
-
我通常不会去场外了解您的问题(下一次,请包括所有相关数据,以便您的问题是独立的),但我可以告诉您认为页面的服务器响应 not 包含带有
ng-scope属性的<div>。它必须通过 JavaScript 创建,在这种情况下,您应该查看我上面给出的建议副本。 (通过禁用 JavaScript 然后尝试加载页面自己尝试。) -
克里斯是对的,你需要
selenium
标签: python html python-3.x web-scraping beautifulsoup