【发布时间】:2020-05-24 17:03:00
【问题描述】:
来自cuda document 声明:
- 如果通过驱动程序 API 创建上下文并使其成为当前上下文,则后续运行时调用将获取此上下文,而不是创建新上下文。
- 如果运行时已初始化(在 CUDA 运行时中隐含提及),可使用 cuCtxGetCurrent() 检索初始化期间创建的上下文。后续驱动程序 API 调用可以使用此上下文。
我可以使第一点起作用。我可以从 cuda 驱动程序创建上下文。然后我可以使用 cuda 运行时函数而不调用 cudaSetDevice(),这会隐式创建一个新的主上下文。
但是,我想通过第二个选项工作。那就是先初始化运行时然后执行cuCtxGetCurrent() 并在 cuda 驱动程序 api 中使用它。这根本不起作用。我总是提出错误说上下文已被破坏或无效。我做错了什么?
这是我的示例代码:
#define CUDA_DRIVER_API
#include <cuda.h>
#include <cuda_runtime.h>
#include <helper_cuda.h>
#include <iostream>
CUcontext check_current_ctx()
{
CUcontext context{0};
unsigned int api_ver;
checkCudaErrors(cuCtxGetCurrent(&context));
fprintf(stdout, "current context=%p\n", context);
checkCudaErrors( cuCtxGetApiVersion(context, &api_ver));
fprintf(stdout, "current context api version = %d\n", api_ver);
return context;
}
auto inital_runtime_context()
{
int current_device = 0;
int device_count = 0;
int devices_prohibited = 0;
CUcontext current_ctx{0};
cudaDeviceProp deviceProp;
checkCudaErrors(cudaGetDeviceCount(&device_count));;
if (device_count == 0) {
fprintf(stderr, "CUDA error: no devices supporting CUDA.\n");
exit(EXIT_FAILURE);
}
// Find the GPU which is selected by Vulkan
while (current_device < device_count) {
cudaGetDeviceProperties(&deviceProp, current_device);
if ((deviceProp.computeMode != cudaComputeModeProhibited)) {
checkCudaErrors(cudaSetDevice(current_device));
checkCudaErrors(cudaGetDeviceProperties(&deviceProp, current_device));
printf("GPU Device %d: \"%s\" with compute capability %d.%d\n\n",
current_device, deviceProp.name, deviceProp.major,
deviceProp.minor);
CUcontext current_ctx;
cuCtxGetCurrent(¤t_ctx);
std::cout << "current_ctx=" << current_ctx << "\n";
return current_device;
} else {
devices_prohibited++;
}
current_device++;
}
if (devices_prohibited == device_count) {
fprintf(stderr,
"CUDA error:"
" No Vulkan-CUDA Interop capable GPU found.\n");
exit(EXIT_FAILURE);
}
return -1;
}
void test_runtime_driver_op()
{
inital_runtime_context();
check_current_ctx();
}
它报告:
GPU Device 0: "GeForce RTX ..." with compute capability 7.5
current_ctx=0x6eb220
current context=0x6eb220
CUDA error at ... code=201(CUDA_ERROR_INVALID_CONTEXT) "cuCtxGetApiVersion(context, &api_ver)"
【问题讨论】:
-
您可能需要实际包含一个 API 调用,如
cudafree(0)以使运行时 API 创建一个上下文。您现有的代码可能不会强制创建惰性上下文 -
@talonmies 非常感谢!这真的有效。但是那文件有错吗?由于从文档中, cudaSetDevice() 应该已经创建了 cuda 上下文。你能把这个总结为答案吗?那我就接受了。
-
我不认为文档是错误的,但是在运行时 API 中创建上下文的确切时间和方式一直有点模棱两可