【发布时间】:2020-07-05 03:20:49
【问题描述】:
我有一个填充了一些值的固定数组,我正在尝试用频域中的尖峰执行这个数组的卷积。尖峰意味着数组中的所有值都为零,除了一个地方,例如 a=[0,0,1,0,0,] 我必须创建这个峰值大约 100 万次 .. 每次将值 1 放在不同的索引处...
float *spike = (float *) malloc(sizeof(float)*len);
memset(spike,0,sizeof(float)*len);
void compute_spike(float *spike, int ind)
{
spike[ind] = 1.0;
}
如何在 GPU 上高效地创建 cufft 复杂类型的尖峰阵列?您还可以假设我有一个包含 100 万个索引的数组。执行此卷积的最佳策略是什么?我应该在主机上创建这个尖峰,然后移动并执行 fft、convolve 和 ifft 吗?或者我应该如何在 GPU 上即时创建它?
【问题讨论】: