【问题标题】:Perfmon - L2 cache miss per threadPerfmon - 每个线程的 L2 缓存未命中
【发布时间】:2012-11-05 15:14:56
【问题描述】:
Architecture:
**AMD** Opteron quad-core using 2 CPUs --- Numa system
Each CPU has a shared L3 Cache ; Each Core has a private L1 and L2

Processor : x86_64 Operating System: GNU/Linux

我是Perfmon 的新世界。我正在尝试获取像Last level cache misses(LLCM)IPS 这样的性能计数器。

当只有一个线程/核心时,我可以获取它们

当有多个2 threads/core 时,是否也可以获取每个线程的性能计数器,例如 IPS 和 LLCM?。

根据我的研究 - 我意识到,当有多个 thread/core 时,不可能为每个线程获取 LCM/IPS,因为 AMD 不提供这些性能计数器。

所以,我的问题是,是否可以在 2 级缓存中获取 PC/线程。 如果是 - 如何?

谢谢。

【问题讨论】:

    标签: scheduling x86-64 perfmon


    【解决方案1】:

    我对此进行了更多研究,并询问了我的教授。

    看起来 perfmon 确实允许我们这样做。

    希望这会有所帮助。如果我能以某种方式提供帮助,请告诉我。

    【讨论】:

      猜你喜欢
      • 2020-05-19
      • 2011-07-05
      • 2016-10-18
      • 2014-02-08
      • 1970-01-01
      • 1970-01-01
      • 2011-10-08
      • 2011-07-27
      • 2017-09-26
      相关资源
      最近更新 更多