【发布时间】:2020-07-29 03:26:03
【问题描述】:
这是此处讨论的延伸:pycuda shared memory error "pycuda._driver.LogicError: cuLaunchKernel failed: invalid value"
pycuda中有没有等价于下面C++ API调用的方法?
#define SHARED_SIZE 0x18000 // 96 kbyte
cudaFuncSetAttribute(func, cudaFuncAttributeMaxDynamicSharedMemorySize, SHARED_SIZE)
在最近的 GPU (Nvidia V100) 上工作,超过 48 KB 共享内存需要设置此函数属性。没有它,就会出现与上述主题相同的启动错误。设备上的“硬”限制是 96 KB 共享内存(为 L1 缓存留出 32 KB)。
有一个已弃用的方法Fuction.set_shared_size(bytes) 听起来很有希望,但我找不到它应该被替换的内容。
【问题讨论】:
标签: pycuda