【发布时间】:2020-07-23 23:05:53
【问题描述】:
我正在尝试制作一个机器人,一旦新产品在网站上上线,就会向我发送电子邮件。
我尝试通过 requests 和 beautifulSoup 来做到这一点。
这是我的代码:
import requests
from bs4 import BeautifulSoup
URL = 'https://www.vinted.fr/vetements?search_text=football&size_id[]=207&price_from=0&price_to=15&order=newest_first'
headers = {'User-Agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36"}
page = requests.get(URL, headers=headers)
soup = BeautifulSoup(page.content, 'html.parser')
products = soup.find_all("div", class_="c-box")
print(len(products))
接下来,我要循环比较新请求前后的产品数量。
但是当我尝试查看找到的产品数量时,我得到一个空列表:[]
我不知道如何解决这个问题......
我用的div在别人的div里,不知道有没有关系
提前致谢
【问题讨论】:
-
我在运行您的脚本时收到 403。所以,soup 对象可能没有解析所需的 dom
标签: python beautifulsoup python-requests