【发布时间】:2012-10-09 19:02:11
【问题描述】:
我是 NUMA 感知多线程编程的新手。我正在编写我的代码,以便所有线程及其内存分配都限制在一个节点上。在程序开始时,我进行了以下调用:
struct bitmask *bm = numa_parse_nodestring("0");
if (bm == 0) {
exit(1);
}
numa_bind(bm);
我的理解是,以这种方式调用 numa_bind 会将所有线程和所有内存分配绑定到节点 0。
此外,当我从这段代码启动 pthreads 时,我使用以下方法将它们绑定到特定 CPU:
pthread_setaffinity_n
但是,当我查看 /proc//numa_maps 时,我仍然可以看到某些库(例如 libc)绑定到节点 1 上的内存。如何确保进程所需的所有内存都在绑定到节点 0?
【问题讨论】:
-
我想知道。但是在阅读this post(下面提到的 Chrstinane)之后,我认为即使有办法让内核将所有共享库加载到您指定的节点,它也可能会遇到其他性能问题——其他进程需要获取来自远程节点的共享库。将数据从一个节点传输到另一个节点是通过 QPI/UPI(或你机器上的任何东西),它很慢,我想有一些锁用于一致性目的,减慢你的应用程序
-
我听说的另一种方法是删除页面缓存(可能多次),希望您的应用程序是第一个请求
libc的应用程序,以便它从磁盘加载到 NUMA 节点上的页面缓存你想要的。
标签: numa