【发布时间】:2021-07-28 07:18:13
【问题描述】:
我对 python 非常陌生,甚至是整体编码。我已经使用此代码成功抓取了大约 10 个网站,但很遗憾它不适用于该网站。我想用每个产品的类提取所有 div。但是 div 没有出现在 page_soup 中。我读到 ::before 和 ::after 是一个问题,但我找不到有效的解决方案。我的代码中可能有多个问题,但我找不到它们。我有两个星期的不眠之夜。请帮忙
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
url = "https://www.woolworths.co.za/cat?No=60&Nrpp=60&Ns=p_pl30|0"
uClient=uReq(url)
page_html=uClient.read()
uClient.close()
page_soup=soup(page_html,"html.parser")
containers=page_soup.findAll("div",{"class":"product-list__item"})
print(containers)
quit()
我得到的结果 []
如果我必须提供更多信息,请告诉我
【问题讨论】:
-
您的问题与
::before/::after无关 - 您没有得到结果,因为页面正在动态加载内容,并且您的 div 在获取时不在页面上。 -
我不知道该怎么做,我尝试使用 time() 等待页面加载,知道如何获取 div
标签: python css web-scraping beautifulsoup pseudo-element