【问题标题】:how to compile cuda kernel without optimizing at all?如何在不优化的情况下编译 cuda 内核?
【发布时间】:2012-10-15 07:37:25
【问题描述】:

如果我编译这个

__global__ void dummy_kernel(float *a, int N, float* b, int N2){
    unsigned int i = blockIdx.y*blockDim.y + threadIdx.y;
    unsigned int j = blockIdx.x*blockDim.x + threadIdx.x; 
}

我得到了这个空的 ptx 代码

.entry _Z9dummy_kernelPfiS_i(
.param .u64 _Z9dummy_kernelPfiS_i_param_0,
.param .u32 _Z9dummy_kernelPfiS_i_param_1,
.param .u64 _Z9dummy_kernelPfiS_i_param_2,
.param .u32 _Z9dummy_kernelPfiS_i_param_3
)
{

ret; 
}

有没有办法强制编译器在不优化的情况下生成ptx?

【问题讨论】:

    标签: cuda gpgpu


    【解决方案1】:

    试试 -g -G 开关 看看它会输出什么 我不确定这会涵盖所有可能的优化

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-10-22
      • 1970-01-01
      • 2020-11-11
      • 1970-01-01
      • 2019-06-20
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多