【发布时间】:2012-11-05 15:14:56
【问题描述】:
Architecture:
**AMD** Opteron quad-core using 2 CPUs --- Numa system
Each CPU has a shared L3 Cache ; Each Core has a private L1 and L2
Processor : x86_64 Operating System: GNU/Linux
我是Perfmon 的新世界。我正在尝试获取像Last level cache misses(LLCM) 和IPS 这样的性能计数器。
当只有一个线程/核心时,我可以获取它们
当有多个2 threads/core 时,是否也可以获取每个线程的性能计数器,例如 IPS 和 LLCM?。
根据我的研究 - 我意识到,当有多个 thread/core 时,不可能为每个线程获取 LCM/IPS,因为 AMD 不提供这些性能计数器。
所以,我的问题是,是否可以在 2 级缓存中获取 PC/线程。 如果是 - 如何?
谢谢。
【问题讨论】:
标签: scheduling x86-64 perfmon