FastAPI/Unvicorn 请求在中间件调用 call_next（路径操作函数）期间挂起答案

【问题标题】：FastAPI/Unvicorn request hanging during invocation of call_next (path operation function) in middlewareFastAPI/Unvicorn 请求在中间件调用 call_next（路径操作函数）期间挂起
【发布时间】：2021-11-20 06:08:47
【问题描述】：

我们在 EC2 上运行的 docker 容器内有一个机器学习模型。

我们使用 Cortex.dev 来自动扩展 GPU。

不确定地，请求将在 FastAPI 中间件中的 call_next 函数期间挂起。不幸的是，它无法重现。

Middleware pre-request 打印行被记录，但路径操作函数中的第一个打印语句从未被记录。

我们尝试过的事情：

使用 1 名工人运行 Uvicorn
在没有异步的情况下运行 run 函数
以bytes 作为image 的参数类型而不是UploadFile 运行

这些更改都不能解决挂起的问题，但这是性能最高的配置。

这是否意味着问题出在 FastAPI 而不是 Uvicorn？
如果是，什么会导致 FastAPI 挂起？如果不是，问题出在哪里？如何解决？

Dockerfile

FROM nvidia/cuda:11.4.0-runtime-ubuntu18.04

WORKDIR /usr/src/app

RUN apt-get -y update && \
    apt-get install -y --fix-missing \
    build-essential \
    cmake \
    python3 \
    python3-pip \
    ffmpeg \
    libsm6 \
    libxext6 \
    && apt-get clean && rm -rf /tmp/* /var/tmp/*

ADD ./requirements.txt ./

# install our dependencies
RUN python3 -m pip install --upgrade pip && python3 -m pip install -r requirements.txt && apt-get clean && rm -rf /tmp/* /var/tmp/*

ADD ./ ./

ENV LC_ALL=C.UTF-8 
ENV LANG=C.UTF-8

EXPOSE 8080

CMD uvicorn api:app --host 0.0.0.0 --port 8080 --workers 2

api.py

from my_predictor import PythonPredictor
from typing import Optional
from datetime import datetime
import time
from starlette.responses import Response

from fastapi import FastAPI, File, UploadFile, Form, Response, HTTPException, Request
from fastapi.middleware.cors import CORSMiddleware

app = FastAPI()

origins = ["*"]

app.add_middleware(
    CORSMiddleware,
    allow_origins=origins,
    allow_credentials=True,
    allow_methods=["*"],
    allow_headers=["*"],
)


@app.middleware("http")
async def add_process_time_header(request: Request, call_next):
    cortex_id = request.headers.get('x-request-id')
    start_time = time.time()
    print("Cortex ID: " + cortex_id + ". > Middleware pre-request. Time stamp: " + str(start_time), flush=True)

    response = await call_next(request)

    process_time = time.time() - start_time
    print("Cortex ID: " + cortex_id + ". > Middleware post-response. Duration: " + str(process_time), flush=True)

    return response



@app.post("/")
async def run(request: Request, image: UploadFile = File(...), renderFactor:Optional[int] = Form(12), requestId:Optional[str] = Form('-1'),include_header:Optional[str] = Form('bin')):

    try:
        cortexId = request.headers.get('x-request-id')
        print("Cortex ID: " + cortexId + ". Request ID: " + requestId + " >>> Request received. Time stamp: " + str(datetime.now()))

        start = time.time()
    
        image = await image.read()

        payload = {}
        payload['image'] = image
        payload['renderFactor'] = renderFactor
        payload['requestId'] = requestId
        payload['include_header'] = include_header
        
        response = pred.predict(payload)

        end = time.time()

        totalTime = round(end - start, 2)

        print("Cortex ID: " + cortexId + ". Request ID: " + requestId + " > Request processed. Duration: " + str(totalTime) + " seconds. Time stamp: " + str(datetime.now()))

        if totalTime > 5:
            print("Long request detected. Duration: " + str(totalTime))

        return response
        
    except Exception as error:
        end = time.time()
        print(str(error))
        print("Cortex ID: " + cortexId + ". Request ID: " + requestId + " > Error. Duration: " + str(round(end - start, 2)) + " seconds . Time stamp: " + str(datetime.now()))

        raise HTTPException(status_code = 500, detail = str(error))

config = {}
pred = PythonPredictor(config)

【问题讨论】：

docker exec -it ${image_id} bash 进入正在运行的容器并使用 gdb 进行调试 - wiki.python.org/moin/DebuggingWithGdb
@NikitaAlmakov 感谢您的帮助。我们能够生成此跟踪，但我坚持隔离导致容器挂起的确切原因：gist.github.com/panabee/1710b94f2a6d1291051b55f26bab54fc。还有什么建议吗？
尝试检查每个线程：info threads，例如thread 2 然后是 py-up、py-down 和 py-list 命令来查看堆栈的每个级别 - devguide.python.org/gdb
您可以尝试使用 http 202 作为解决方法吗？ github.com/tiangolo/fastapi/issues/3
另外，请检查此票证以了解非阻塞异步和配置 uvicorn 以进行长时间请求

标签： python python-requests fastapi uvicorn

【解决方案1】：

解决方案 1

从您的代码中，我可以看到您使用了来自 starlette.responses 包和 FastAPI 的响应包的响应，这可能导致了挂起问题

from starlette.responses import Response

# remove the Response from fastapi
from fastapi import FastAPI, File, UploadFile, Form, HTTPException, Request

解决方案 2

如果您的问题仍然存在

FastAPI documentation 声明从fastapi 包导入的Request 理想情况下来自Starlette(Starlette Requests documentation link)

您也可以使用from starlette.requests import Request。 FastAPI 为开发人员提供了便利。但它直接来自Starlette。

将from fastapi import Request替换为from starlette.requests import Request

在this link 的官方 FastAPI github 问题中存在类似问题，该应用程序是使用 uvicorn <file>:app 运行的。下面用starlette.requests直接实现的代码块没有产生挂起的问题，说明这个问题是由FastAPI引起的。

from starlette.applications import Starlette
from starlette.requests import Request
from starlette.responses import JSONResponse

app = Starlette()


@app.middleware("http")
async def func(request: Request, call_next):
    #print(await request.json())
    return await call_next(request)


@app.route('/', methods=["POST"])
def homepage(request):
    return JSONResponse({"Hello": "World"})

确保在您的代码中使用 starlette.requests 和 starlette.responses，如下所示

from starlette.responses import Response
from starlette.requests import Request

# Request and Response removed from fastapi as directly referred from starlette
from fastapi import FastAPI, File, UploadFile, Form, HTTPException 
from fastapi.middleware.cors import CORSMiddleware

app = FastAPI()

origins = ["*"]

app.add_middleware(
    CORSMiddleware,
    allow_origins=origins,
    allow_credentials=True,
    allow_methods=["*"],
    allow_headers=["*"],
)


@app.middleware("http")
async def add_process_time_header(request: Request, call_next):
    cortex_id = request.headers.get('x-request-id')
    start_time = time.time()
    print("Cortex ID: " + cortex_id + ". > Middleware pre-request. Time stamp: " + str(start_time), flush=True)

    response = await call_next(request)

    process_time = time.time() - start_time
    print("Cortex ID: " + cortex_id + ". > Middleware post-response. Duration: " + str(process_time), flush=True)

    return response

【讨论】：

@crashalot 直接用starlette.requests 实现，而不是fastapi 的Request。这将解决您的悬挂问题
@Crashalot 如果我的回答对您的问题有所帮助，请考虑voting up 和accepting it，方法是单击大向上箭头（三角形），勾选并单击每个答案旁边的赏金图标手动将您的赏金奖励给恰当的答案。
查看此问题 (github.com/tiangolo/fastapi/issues/394)，尚不清楚问题与 FastAPI Response 对象隔离的位置。您介意分享您的确切意思吗，或者我们可以在哪里了解更多信息？谢谢！
@Crashalot 解决方案 1 指的是代码中的更正，因为您已经从 starlette.responses 和其他 fastapi 引用了两次 Response 对象。如您的代码所示 from starlette.responses import Response 和其他引用的响应对象 from fastapi import FastAPI,File,UploadFile,Form,Response,……
如果解决方案 1 不能解决您的问题。而不是引用来自 fastapi 的 Request 对象，而是引用来自 starlette.request 的人引用的 GitHub 问题，他们在使用 from fastapi import Request 时面临悬而未决的问题，但在 starlette 中的相关代码实现方面没有遇到任何问题.request.