【发布时间】:2021-11-02 16:30:58
【问题描述】:
一直在尝试使用 python 和 beautifulsoup 将笔记本电脑名称和价格的 Jumia 网站抓取到 csv 文件中,但我的代码一直只返回 csv 文件中的标题。 是不是我做错了什么?
这是我的代码
import requests
from bs4 import BeautifulSoup
import pandas as pd
import csv
page_url="https://www.jumia.com.ng/laptops/hp/"
uClient=requests.get(page_url).text
page_soup=BeautifulSoup(uClient, "html.parser")
containers=page_soup.findAll("div", {"class":"info"})
containers
filename="jumia.csv"
f=open(filename, "w")
headers="brand, price, \n"
f.write(headers)
for contain in containers:
try:
product=contain.find("h3", {"class":"name"})
except:
product=none
try:
cost=contain.find("div", {"class":"prc"})
except:
cost=none
f=open("jumia.csv.txt","w")
f.write("product" + "cost" + "\n")
print(product, cost)
f.close()
谢谢
【问题讨论】:
-
你检查答案了吗?可能是大量的javascript,所以你“不能”使用bs4。尝试将用户代理传递给您的请求: headers={'user.agent': check your user agent}
标签: python csv web-scraping beautifulsoup