【问题标题】:What does pprof -call_tree do?pprof -call_tree 有什么作用?
【发布时间】:2022-01-14 08:29:17
【问题描述】:

go tool pprof 有一个-call_tree 选项,根据-help,应该“创建一个上下文相关的调用树”。但是,CPU 配置文件上的pprof -tree 在有和没有这个选项的情况下都会给我完全相同的输出。它看起来像这样(一个代表节点):

      flat  flat%   sum%        cum   cum%   calls calls% + context          
----------------------------------------------------------+-------------
                                             0.07s 35.00% |   google.golang.org/grpc/internal/transport.(*http2Server).operateHeaders
                                             0.04s 20.00% |   golang.org/x/net/http2.(*Framer).readMetaFrame
                                             0.02s 10.00% |   github.com/Shopify/sarama.(*FetchResponse).decode
     0.06s  0.79% 51.18%      0.20s  2.63%                | runtime.mapassign_faststr
                                             0.05s 25.00% |   runtime.newobject (inline)
                                             0.03s 15.00% |   aeshashbody
                                             0.03s 15.00% |   runtime.mallocgc

这显然不是一棵树,尤其是因为它显示了在 HTTP/2 下的 Sarama——从 Kafka 消费(通过 Sarama)和提供 HTTP/2 是这个过程同时执行的两个独立的事情。

为什么-call_tree 不影响-tree 的输出?一般来说,-call_tree 是做什么的?

额外积分

我上面显示的输出节点的确切含义是什么?这是否意味着包含mapassign_faststr 的样本中有35% 也包含operateHeaders,而10% 包含decode?下面的几行如mallocgc呢?

我可以阅读哪些文件来回答上述问题?

【问题讨论】:

    标签: go profiling pprof


    【解决方案1】:

    为什么 -call_tree 不影响 -tree 的这个输出

    我认为-call_tree 选项不会改变-tree 的输出,输出实际上不是一棵树,它输出的是树的节点(更多信息请参见额外的信用部分)。


    一般来说,-call_tree 有什么作用?

    当您查看使用-png 标志生成的图像时,您可以看到不同之处,而没有-call_tree 标志: 并使用 -call_tree 标志:

    因此,pprof 尝试根据上下文创建单独的树,而不是拥有 1 个调用树。在我的情况下(将列出它们,因为图像上的文本不可读)根是:

    • testing.(*B).launch(基准/测试框架)
    • runtime.gcBgMarkWorker(运行时 GC 的一部分)
    • runtime.bgsweep(运行时 GC 的一部分)
    • runtime.mcall(运行时调度程序的一部分)
    • runtime.morestack(与堆栈有关:))

    在非-call_tree图像中,这些节点仍然存在,但从中间树开始,就好像我们的代码直接调用这些背景处理。

    基本上,该选项的作用是删除/隐藏函数之间的不频繁调用,因此您最终会为每组经常相互调用的函数生成一棵树。

    我还没有对此进行测试,但我想 pprof 也会对用户代码进行这种上下文感知树分离。总而言之,它返回一个主观上更易读的树,或者至少是一个更相关的树。


    我上面显示的输出节点的确切含义是什么?

    -tree 选项尝试输出树,如图所示。但由于它是文本输出,它一次显示树的 1 个节点,context 列中的非缩进行是当前节点,上面的行是调用当前节点的节点,节点下面的行是这个调用(图中的箭头)。

    calls% 是传入或传出边缘的"weight",因此确实是来自函数的调用百分比。


    我可以阅读哪些文件来回答上述问题?

    如果通过查看源代码了解所有这些,以下是一些关键部分,以防您感兴趣:

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2017-09-16
      • 1970-01-01
      • 2015-09-01
      • 1970-01-01
      • 1970-01-01
      • 2021-08-28
      • 2014-04-07
      相关资源
      最近更新 更多