【问题标题】:REST API Response time increases under load [Tomcat]REST API 响应时间在负载下增加 [Tomcat]
【发布时间】:2015-11-29 17:39:24
【问题描述】:

我们有一个 REST API (GET),可以同时被许多移动用户调用。我们目前的用户群约为 30 万,但预计将增长约 100 万。

API 很简单。它使用 Akka 发出 3 个并行请求,并返回组合结果。主要代码如下所示:

        Future<List<CardDTO>> pnrFuture = null;
        Future<List<CardDTO>> newsFuture = null;

        ExecutionContext ec = ExecutionContexts.fromExecutorService(executor);

        final List<CardDTO> combinedDTOs = new ArrayList<CardDTO>();

        // Array list of futures
        List<Future<List<CardDTO>>> futures = new ArrayList<Future<List<CardDTO>>>();

        futures.add(future(new PNRFuture(pnrService, userId), ec));
        futures.add(future(new NewsFuture(newsService, userId), ec));
        futures.add(future(new SettingsFuture(userPreferenceManager, userId), ec));

        Future<Iterable<List<CardDTO>>> futuresSequence = sequence(futures, ec);

        // combine the cards
        Future<List<CardDTO>> futureSum =  futuresSequence.map(
                new Mapper<Iterable<List<CardDTO>>, List<CardDTO>>() {
                    @Override
                    public List<CardDTO> apply(Iterable<List<CardDTO>> allDTOs) {

                        for (List<CardDTO> cardDTOs : allDTOs) {

                            if(cardDTOs!=null)
                                combinedDTOs.addAll(cardDTOs);

                        }

                        Collections.sort(combinedDTOs);

                        return combinedDTOs;
                    }
                }
        );

        Await.result(futureSum, Duration.Inf());

        return combinedDTOs;

这 3 个期货是来自 MY SQL 数据库的简单选择语句,执行时间不到一毫秒。我们这里使用的是 Spring + Hibernate。

整个 API 平均需要 50 毫秒才能返回结果。

现在,当我们对 3 台服务器进行性能测试时,我们得出的结论是,在大约 200 个请求/秒之后,API 的响应时间开始线性增加。它在负载下高达 3 -5 秒。令人惊讶的是,当时 CPU 使用率约为 20%,而 JVM 内存中没有发生任何重大变化。内存使用量约为 700 MB。我们有 16 GB

我找不到瓶颈在哪里。如何将此 API 扩展到至少 1000 个请求/秒。我至少在寻找关于从哪里开始的指针。我探索过topvisualvm 等工具,但没有发现任何令人担忧的地方。

这是我们在 Java 7 上的 JVM 设置

导出 JAVA_OPTS="$JAVA_OPTS -Djava.awt.headless=true -server -Xms4g -Xmx16g -XX:MaxPermSize=1g -XX:PermSize=512m -XX:MaxNewSize=4g -XX:NewSize=512m -XX:SurvivorRatio=16 -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:MaxTenuringThreshold=0 -XX :CMSInitiatingOccupancyFraction=60 -XX:+CMSParallelRemarkEnabled -XX:+UseCMSInitiatingOccupancyOnly -XX:ParallelGCThreads=12 -XX:LargePageSizeInBytes=256m -Dspring.profiles.active=staging -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote .port=9899 -Djava.rmi.server.hostname=$HOSTNAME -Dcom.sun.management.jmxremote.authenticate=false -Dcom.sun.management.jmxremote.ssl=false"

我已经阅读了这些问题,这似乎是一种普遍趋势。切换到 node.js 或 Erlang 等其他框架会有帮助吗?

Response time Increases as concurrency increases in Java

Tomcat response time is increasing as concurrency is increased in apache bench

【问题讨论】:

  • 连接器默认的 maxThreads 值为 200。看看tomcat.apache.org/tomcat-7.0-doc/config/http.html
  • 我尝试使用 BIO 连接器将该值增加到 5000
  • 你也试过增加acceptCount值吗?
  • 小心Await.result(futureSum, Duration.Inf()); 声明。它会阻塞线程,因此可能会产生性能问题。
  • 还有什么办法吗?

标签: java spring performance tomcat akka


【解决方案1】:

无法确定您的性能问题出在哪里,但我发现它通常是因为(根据您的描述):

  • 存在争用问题的线程或连接池(数据库连接池或 tomcat 请求池)
  • 同步变量/代码或 BlockingQueue(可以是上述的超集)。
  • 负载平衡器或配置错误
  • 网络不好

我建议你做的是尽可能地隔离。首先证明不是数据库连接池。那就是运行相同的并发负载,但只执行数据库部分。记住三台服务器需要 3x 连接。

接下来运行 1-3 台服务器进行模拟响应,而不使用负载平衡器进行任何数据处理。您会惊讶于负载平衡器/网络多久会导致问题。

继续分离事物。测试、观察、重复。

最后,当您将它真正隔离为 Tomcat 时,您可能想阅读 Netflix does 的内容。

【讨论】:

    猜你喜欢
    • 2023-04-05
    • 2017-11-21
    • 1970-01-01
    • 2021-01-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-01-07
    • 2015-07-01
    相关资源
    最近更新 更多