【问题标题】:Accessing device memory in Cuda在 Cuda 中访问设备内存
【发布时间】:2014-06-14 14:29:56
【问题描述】:

我在将主机内存复制到设备内存后尝试访问设备内存。当尝试打印从主机内存复制到设备内存的数据时,执行结果不正确..它说分段错误,我知道我正在尝试从不可用的设备内存打印数据或无法访问。

帮助我如何访问此设备内存,并且我想确保如果我修改主机内存数据,那么我希望在尝试打印时在设备内存数据中看到该更改。

下面是我的代码

// includes, system
#include <stdio.h>
#include <assert.h>

// Simple utility function to check for CUDA runtime errors
void checkCUDAError(const char *msg);


int main( int argc, char** argv)
{
    // pointer and dimension for host memory
    int n, dimA;
    float *h_a;

    // pointers for device memory
    float *d_a, *d_b;

    // allocate and initialize host memory
    /** Bonus: try using cudaMallocHost in place of malloc **/

    dimA = 8;
    size_t memSize = dimA*sizeof(float);
    cudaMallocHost((void**)&h_a, memSize);
    //h_a = (float *) malloc(dimA*sizeof(float));
    for (n=0; n<dimA; n++)
    {
        h_a[n] = (float) n;
    }

    // Part 1 of 5: allocate device memory

    cudaMalloc( (void**)&d_a, memSize );
    cudaMalloc( (void**)&d_b, memSize );

    // Part 2 of 5: host to device memory copy
    cudaMemcpy( d_a, h_a, memSize, cudaMemcpyHostToDevice   );

    // Part 3 of 5: device to device memory copy
    cudaMemcpy( d_b, d_a, memSize, cudaMemcpyDeviceToDevice );

    // clear host memory
    for (n=0; n<dimA; n++)
    {
        printf("Data in host memory h_a %f\n", h_a[n]);
        printf("Data in device memory d_a %f\n", d_a[n]);
        //printf("Data in device memory d_b %f\n", d_b[n]);
        h_a[n] = 0.f;
    }

    // Part 4 of 5: device to host copy
    cudaMemcpy( h_a, d_b, memSize, cudaMemcpyDeviceToHost );

    // Check for any CUDA errors
    checkCUDAError("cudaMemcpy calls");

    // verify the data on the host is correct
    for (n=0; n<dimA; n++)
    {
        assert(h_a[n] == (float) n);
    }

    // Part 5 of 5: free device memory pointers d_a and d_b
    cudaFree( d_b );
    cudaFree( d_a );

    // Check for any CUDA errors
    checkCUDAError("cudaFree");

    // free host memory pointer h_a
    // Bonus: be sure to use cudaFreeHost for memory allocated with cudaMallocHost

    cudaFreeHost(h_a);
    //free(h_a);

    // If the program makes it this far, then the results are correct and
    // there are no run-time errors.  Good work!
    printf("cudaMallocHost is working Correct!\n");

    return 0;
}

void checkCUDAError(const char *msg)
{
    cudaError_t err = cudaGetLastError();
    if( cudaSuccess != err)
    {
        fprintf(stderr, "Cuda error: %s: %s.\n", msg, cudaGetErrorString( err) );
        exit(-1);
    }
}

所以在将内存从 d_a 复制到 d_b 之后的代码中,当我尝试在 d_b 内存中打印数据时,它会给出错误。并且打印 h_a 内存会产生很好的效果。我在尝试在 d_b 内存中打印数据时做错了吗?

【问题讨论】:

    标签: c cuda


    【解决方案1】:

    您无法从主机代码访问设备内存。此行是非法的:

        printf("Data in device memory d_a %f\n", d_a[n]);
    

    它需要取消引用主机代码中的设备指针(指向设备内存的指针),这在 CUDA 中是非法的(统一内存使用除外)。

    如果您想查看设备内存设置是否正确,您可以将设备内存中的数据复制回主机内存,您将在接下来的代码行中执行(和检查)该操作。因此,只需删除 printf 声明即可。这是非法的。

    【讨论】:

    • 没有办法直接在主机代码中使用设备指针指向的数据,除非你使用统一内存。通常,使用设备数据的第一步是将其复制回主机,例如使用cudaMemcpy,例如代码中的这一行:` cudaMemcpy( h_a, d_b, memSize, cudaMemcpyDeviceToHost );` 之后,d_b 中的数据现在由 h_a 指向并且可以这样使用.
    猜你喜欢
    • 2012-06-15
    • 1970-01-01
    • 2010-12-16
    • 1970-01-01
    • 1970-01-01
    • 2015-06-28
    • 2010-09-22
    • 2012-07-10
    • 1970-01-01
    相关资源
    最近更新 更多