【问题标题】:403 response in coches.net using requestscoches.net 中使用请求的 403 响应
【发布时间】:2021-11-17 15:14:24
【问题描述】:

我对网络抓取非常陌生。我想在 coches.net 网站上进行 scraping 来做一些有趣的数据分析练习,但是下面的代码总是返回 403 响应。

import requests
from bs4 import BeautifulSoup
import time

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36'}
base_url = 'https://www.coches.net/segunda-mano/?pg={}&st=1'


for counter in range(1,80):
    url = base_url.format(counter)
    # Get links
    response = requests.get(url)
    print (response.status_code)
    soup = BeautifulSoup(response.content, "html.parser")
    blocks = soup.select('.mt-Card-body')
    print (blocks)
    time.sleep(1)

我一直在查看一些网页(事实上,我的代码深受我目前所发现的内容的启发),看起来我的代码应该没问题。有什么帮助吗?如何避免 403 响应?是因为我的代码还是 coches.net 不允许 python 脚本访问?

【问题讨论】:

    标签: python web-scraping beautifulsoup http-status-code-403


    【解决方案1】:

    您已创建标题但不使用它们。 尝试使用您的用户代理,您将获得200 状态码

    response = requests.get(url, headers=headers)
    

    如果我帮助你 - 请标记答案为正确

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2016-08-17
      • 1970-01-01
      • 2022-01-17
      • 2022-01-18
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多