RETRY_ENABLED = True  #打开重试开关
RETRY_TIMES = 3 #重试次数
DOWNLOAD_TIMEOUT = 3 #超时
RETRY_HTTP_CODES = [429,404,403] #重试

HTTPERROR_ALLOWED_CODES = [429] #上面报的是403,就把403加入。
yield scrapy.Request(url=url, cookies=self.cookies, callback=self.parse, dont_filter=True)  #去掉过滤重复的设置(如果有重复的url请求,scrapy就会过滤掉这个请求,把这个设置打开就行了)

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2021-06-02
  • 2022-12-23
  • 2021-08-11
  • 2021-07-09
  • 2022-01-22
猜你喜欢
  • 2022-01-12
  • 2021-12-29
  • 2022-12-23
  • 2022-12-23
  • 2021-09-19
  • 2021-11-06
  • 2022-12-23
相关资源
相似解决方案