【发布时间】:2013-09-04 07:14:49
【问题描述】:
使用 nvcc (CUDA 5.0) 编译下面的代码时,会出现错误“内存限定符的非法组合”,因为在一个类中显然不可能有全局内核。
class A
{
public:
__global__ static void kernel();
};
__global__ void A::kernel()
{}
我在处理非静态成员的时候可以理解这个限制,但是为什么内核声明为静态时仍然会出现错误?此类成员的调用与在命名空间中声明函数时调用函数没有什么不同(在这种情况下为A)。
A::kernel <<< 1, 1 >>> ();
我想知道为什么这还没有实施吗?
编辑:根据答案和 cmets 中的回答,我对我的问题还不够清楚。我的问题不是为什么会出现错误。显然,这是因为它尚未实施。我的问题是为什么它没有被实施。到目前为止,我还没有想到阻止此功能实施的原因。我意识到我可能忘记了一个会使事情复杂化的特殊情况,因此提出了这个问题。
我认为这是一个合理的功能的原因是:
- 静态函数没有
this指针 因此,即使在主机上的对象上调用内核,访问其数据也不会发生冲突,因为首先无法访问此数据(来自什么对象的数据??)。 - 您可能会争辩说,如果该类具有与之关联的静态数据,并且存在于主机上,则原则上应该可以从静态内核访问。但是,也不支持静态数据,因此也不会发生冲突。
- 在主机上的对象上调用静态内核(
A a; a.staticKernel<<<...,...>>>();)完全等同于在没有对象的情况下调用它 (A::staticKernel<<<...,...>>>();),就像我们在常规 C++ 中习惯的那样。
我错过了什么?
【问题讨论】:
-
你的目标是拥有一个具有_ 全局 _函数的类吗?
-
所以这个问题的真正目的是争论为什么 CUDA 对象模型是这样的?这不是Stack Overflow 的问题。投票结束主要基于意见。
-
我想向 NVidia 提交功能请求,因为我觉得不支持这很奇怪。在我这样做之前,我想确保没有明显的理由表明它就是这样。显然没有,显然这是对我投反对票的理由。它与意见或辩论无关。
-
我们这里没有人设计过 CUDA 对象模型。因此,我们没有人能说出为什么它不受支持,因此任何答案充其量只是推测性的。如果我猜测,我会说这是因为它破坏了编译模型- __global__ 函数同时在 一个主机对象和一个设备对象中编译。 CUDA 类和结构只能在一个内存空间中实例化。这似乎排除了在结构和类中包含 __constant__ 或 __global__ 对象
-
@talonmies:我无法提前知道我的问题没有明显的答案,所以我无法预见猜测。如果你问我,答案/cmets 中的反对票和负面语气是非常不必要的。至于您的猜测:当您在其中声明静态函数时,不会向类/结构(在内存中)添加任何内容。声明只是为函数添加范围,类似于命名空间。我会联系 NVidia 看看他们要说什么。
标签: c++ static cuda global member