【发布时间】:2022-01-01 06:08:38
【问题描述】:
here 提供的文档提到,指定地址处的可用数据从内存带到缓存行(作为提示提供的缓存级别)。
但是,我很困惑是否也访问了 LLC(假设提示指定 L1D 或 L2)或者是否总是访问内存的情况 - 无论数据是否在 LLC 中可用。
我问这个问题的原因是,在我的某些实验中,我发现使用 _mm_prefetch 内在函数增加了我的 LLC 负载计数(性能事件),即使我获得了整体性能受益。
【问题讨论】:
-
任何与处理器实现行为相关的问题都需要清楚地标识出正在讨论的哪个处理器。 (即使是看似简单的问题也对应于任何特定实现的大量特殊情况——将这种复杂性乘以未指定的实现,很难给出明确的回答。)
标签: x86 intel cpu-architecture perf prefetch