【问题标题】:CUDA Dynamic Parallelism error : LNK2001CUDA 动态并行错误:LNK2001
【发布时间】:2023-03-17 10:17:01
【问题描述】:

好的,我已经在 VS2012 中从 Python 切换到了 C++,以努力让这个项目再次滚动。在了解其中的来龙去脉时,我遇到了很多障碍和头痛。这是我最新的,最令人沮丧的一个,以及随之而来的编译错误。

1>  C:\Users\Karsten Chu\New Google Drive\Research\Visual Studio 2012\Projects\Dynamic Parallelism Test\Dynamic Parallelism Test>"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v5.5\bin\nvcc.exe" -dlink -o "x64\Debug\Dynamic Parallelism Test.device-link.obj" -Xcompiler "/EHsc /W3 /nologo /Od /Zi /RTC1 /MDd  " -L"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v5.5\lib\x64" cuda.lib cudart.lib kernel32.lib user32.lib gdi32.lib winspool.lib comdlg32.lib advapi32.lib shell32.lib ole32.lib oleaut32.lib uuid.lib odbc32.lib odbccp32.lib -lcudadevrt  -gencode=arch=compute_35,code=sm_35 -G --machine 64 "x64\Debug\CUDA Test 2.cu.obj" "x64\Debug\CUDA Test.cu.obj" 
1>Dynamic Parallelism Test.device-link.obj : error LNK2001: unresolved external symbol __fatbinwrap_54_tmpxft_00000634_00000000_8_cuda_device_runtime_cpp1_ii_5f6993ef
1>C:\Users\Karsten Chu\New Google Drive\Research\Visual Studio 2012\Projects\Dynamic Parallelism Test\x64\Debug\Dynamic Parallelism Test.exe : fatal error LNK1120: 1 unresolved externals
========== Build: 0 succeeded, 1 failed, 0 up-to-date, 0 skipped ==========

还有我的代码。

#include <cuda.h>
#include <cuda_runtime.h>
#include <device_launch_parameters.h>
#include <stdio.h>
#include <iostream>
using namespace std;

__global__ void rkf5(double*, int*);
__global__ void k1(double*);

int main2(int argc, char** argv)
{
    const int max_length = 5;
    double concs[max_length];
    for (int i=0; i<max_length; i++)
    {
        concs[i]=0;
        //std::cout<<concs[i];
    }

    double *d_concs;
    int *d_max_length;
    size_t size_concs = sizeof(concs);
    size_t size_max_length = sizeof(max_length);
    cudaMalloc((void**)&d_concs, size_concs);
    cudaMemcpy(d_concs, concs, size_concs, cudaMemcpyHostToDevice);
    cudaMalloc((void**)&d_max_length, size_max_length);
    cudaMemcpy(d_concs, concs, size_concs, cudaMemcpyHostToDevice);
    rkf5<<<1,max_length>>>(d_concs, d_max_length);
    cudaMemcpy(concs, d_concs, size_concs, cudaMemcpyDeviceToHost);

    for (int i=0; i<max_length; i++)
    {
        std::cout<<concs[i];
    }
    return 0;
}

__global__ void rkf5(double* concs, int* max_length)
{
    int idx = blockIdx.x * blockDim.x + threadIdx.x;
    concs[idx]=idx;
    //dim3 threads = dim3(max_length);
    k1<<< 1, *max_length >>>(concs);
}
__global__ void k1(double* concs)
{
    int idx = blockIdx.x * blockDim.x + threadIdx.x;
    concs[idx]=0;
}

请帮帮我,我花了很多时间在谷歌上搜索这个问题,但我找到的每条线索都没有发布解决方案。

【问题讨论】:

    标签: c++ visual-studio-2012 cuda nvcc


    【解决方案1】:

    用于编译和链接的命令行:

    nvcc.exe -dlink -o "x64\Debug\Dynamic Parallelism Test.device-link.obj" 
    -Xcompiler "/EHsc /W3 /nologo /Od /Zi /RTC1 /MDd  " 
    -L"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v5.5\lib\x64" 
    cuda.lib cudart.lib kernel32.lib user32.lib gdi32.lib winspool.lib  
    comdlg32.lib advapi32.lib shell32.lib ole32.lib oleaut32.lib uuid.lib 
    odbc32.lib odbccp32.lib -lcudadevrt -gencode=arch=compute_35,code=sm_35 -G 
    --machine 64 "x64\Debug\CUDA Test 2.cu.obj" "x64\Debug\CUDA Test.cu.obj"
    

    您正在尝试链接 cudadevrt linux 样式 (-lcudadevrt)。这在 Windows 上不起作用,调用的链接器是 VS 形式的。将cudadevrt.lib 添加到您的链接器输入中,例如cudart.lib

    【讨论】:

    • 太好了,谢谢你的收获。我将尝试将所有这些试验/错误经验编译(hyuk)到一个帖子中,以便跟随我的人不会像我一样在所有相同的陷阱中摔断腿。
    【解决方案2】:

    我已通过以下方式成功编译并运行您的代码:

    1. 使用Using CUDA dynamic parallelism in Visual Studio 2010中的过程;
    2. main2更改为main

    程序输出0123 :-)

    【讨论】:

    • 哈哈,是的,请原谅 main 和 main2 的愚蠢,我对 C++ 和 VS2012 还很陌生,所以我做了一些像这样的外行修复以使错误消息消失。好奇,这意味着我的代码没有到达子内核,否则它应该输出 0。感谢您抽出宝贵时间!
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2017-06-14
    • 2013-10-20
    • 1970-01-01
    • 2017-12-25
    • 1970-01-01
    • 2017-09-25
    相关资源
    最近更新 更多