【发布时间】:2016-03-22 22:47:07
【问题描述】:
据我所知,我们可以在内核内存中分配一个固定内存区域。 (来自KGPU)
然后,在 Pinned 内存中分配 linux 内核数据并传输到 GPU。
但问题是linux内核数据应该排列成数组。
今天,一个案例就是一棵树。
我尝试将其从固定内存传递到 GPU。
但是当一个节点访问下一个节点时,出现内存访问错误。
我想知道统一内存可以分配为内核内存中的固定内存区域吗?
因此树可以在统一内存区域中构建并供 GPU 使用,而无需其他运行时 API,例如 cudaMallocMaganed。
还是说统一内存只能使用cudaMallocMaganed?
【问题讨论】:
标签: c cuda linux-kernel