计算每个请求的重试次数答案

【问题标题】：Count number of retries for each request计算每个请求的重试次数
【发布时间】：2022-01-20 19:18:17
【问题描述】：

我使用包requests 和urllib3.util.retry.Retry() 一起发送数以万计的查询。我试图计算查询的数量和必要的尝试次数，直到我成功检索到所需的数据。我的目标是构建 API 可靠性的衡量标准。

为了修正想法，我们假设requests 的 Response 对象包含以下数据：

from requests import Session
from urllib3.util.retry import Retry
from requests.adapters import HTTPAdapter

def create_session():
    session = Session()
    retries = Retry(
        total = 15,
        backoff_factor = 0.5,
        status_forcelist = [401, 408, 429, 500, 502, 504],
        allowed_methods = frozenset(["GET"])
    )

    session.mount('http://', HTTPAdapter(max_retries=retries))
    session.mount('https://', HTTPAdapter(max_retries=retries))

    return session

urls = ['https://httpbin.org/status/500']
count_queries = len(urls)
count_attempts = 0

with create_session() as s:
    for url in urls:
        response = s.get(url)
        count_attempts += response.total_retries

由于没有这样的变量，我正在寻找替代方法来计算重试总数。

虽然我无法确定解决此问题的方法，但我在搜索过程中进行了以下观察，这可能会有所帮助：

urllib3 将重试历史存储在 Retry 对象中。 urllib3.HTTPResponse 存储最后一个重试对象 (docs)。 urllib3.HTTPResponse（准确地说，它的未解码主体）存储在 requests.Response.raw 中，但仅在 stream=True (docs) 中。据我了解，我无法访问这些数据。
一位用户为similar question 提供了一个解决方案，该解决方案是Retry 类的子类。本质上，调用回调函数将字符串打印到记录器。这可以适应增加计数器而不是打印到日志。但是，如果可能，我更喜欢跟踪特定 get 的重试次数，如上所示，而不是使用同一会话的所有 gets。
here 提出了一个非常相似的问题，但没有提供（有效的）解决方案。

我正在使用 Python 3.9，urllib3 1.26.8，请求 2.26.0。

【问题讨论】：

标签： python python-requests urllib3

【解决方案1】：

这是一个相当冗长的解决方案，类似于this answer。它在会话级别计算请求和重试次数（但是，这不是我的首选方法）。

import requests
from urllib3.util.retry import Retry

class RequestTracker:
    """ track queries and retries """
    def __init__(self):
        self._retries = 0
        self._queries = 0

    def register_retry(self):
        self._retries += 1

    def register_query(self):
        self._queries += 1

    @property
    def retries(self):
        return self._retries

    @property
    def queries(self):
        return self._queries

class RetryTracker(Retry):
    """ subclass Retry to track count of retries """
    def __init__(self, *args, **kwargs):
        self._request_tracker = kwargs.pop('request_tracker', None)
        super(RetryTracker, self).__init__(*args, **kwargs)
    
    def new(self, **kw):
        """ pass additional information when creating new Retry instance """
        kw['request_tracker'] = self._request_tracker
        return super(RetryTracker, self).new(**kw)
    
    def increment(self, method, url, *args, **kwargs):
        """ register retry attempt when new Retry object with incremented counter is returned """
        if self._request_tracker:
            self._request_tracker.register_retry()
        return super(RetryTracker, self).increment(method, url, *args, **kwargs)

class RetrySession(requests.Session):
    """ subclass Session to track count of queries """
    def __init__(self, retry):
        super().__init__()
        self._requests_count = retry

    def prepare_request(self, request):
        """ increment query counter """
        # increment requests counter
        self._requests_count.register_query()
        return super().prepare_request(request)

class RequestManager:
    """ manage requests """    
    def __init__(self, request_tracker=None):
        # session settings
        self.__session = None
        self.__request_tracker = request_tracker

        # retry logic specification
        args = dict(
            total = 11,
            backoff_factor = 1,
            status_forcelist = [401,408, 429, 500, 502, 504],
            allowed_methods = frozenset(["GET"])
        )
        if self.__request_tracker is not None:
            args['request_tracker'] = self.__request_tracker
            self.__retries = RetryTracker(**args)
        else:
            self.__retries = Retry(**args)
    
    @property
    def session(self):
        if self.__session is None:
            # create new session
            if self.__request_tracker is not None:
                self.__session = RetrySession(self.__request_tracker)
            else:
                self.__session = requests.Session()
            
            # mount https adapter with retry logic
            https = requests.adapters.HTTPAdapter(max_retries=self.__retries)
            self.__session.mount('https://', https)
        
        return self.__session
    
    @session.setter
    def session(self, value):
        raise AttributeError('Setting session attribute is prohibited.')

request_tracker = RequestTracker()
request_manager = RequestManager(request_tracker=request_tracker)
session = request_manager.session
urls = ['https://httpbin.org/status/500']

with session as s:
    for url in urls:
        response = s.get(url)

print(request_tracker.queries)
print(request_tracker.retries)

【讨论】：