【发布时间】:2011-10-10 12:04:48
【问题描述】:
我正在寻找一种算法来测试 2 条线段是否以 GPU 友好的方式相交。线段是二维的。虽然网上讨论了许多算法来实现这一点,但我看到的所有算法都使用了大量的分支指令。在 CPU 上,这不是一个问题。但是,在 GPU 上,大量的分支指令会影响性能。
有人知道这种环境的好算法吗?任何示例伪代码、CUDA 代码、OpenCL 代码或 DirectCompute 计算都将不胜感激。
跟进
如果有人感兴趣,这(基本上)是我最终的结果。我把它删减了,所以它更像是伪代码而不是 OpenCL C,但希望它能传达要点。
__kernel void findCrossingLines(__global float2 p1, __global float2 p2,
__global float2 p3, __global float2 p4,
__global bool* output)
{
int result = 0;
float2 A = p2;
float2 a = p2 - p1;
float2 B = p4;
float2 b = p4 - p3;
float2 c = B - A;
float2 b_perp = (float2)(-b.y, b.x);
float numerator = dot(b_perp, c);
float denominator = dot(b_perp, a);
bool isParallel = (denominator == 0.0f);
float quotient = numerator / denominator;
float2 intersectionPoint = (float2)(quotient * a.x + A.x, quotient * a.y + A.y);
*output = (!isParallel &&
intersectionPoint.x >= min(p1.x, p2.x) &&
intersectionPoint.x >= min(p3.x, p4.x) &&
intersectionPoint.x <= max(p1.x, p2.x) &&
intersectionPoint.x <= max(p3.x, p4.x) &&
intersectionPoint.y >= min(p1.y, p2.y) &&
intersectionPoint.y >= min(p3.y, p4.y) &&
intersectionPoint.y <= max(p1.y, p2.y) &&
intersectionPoint.y <= max(p3.y, p4.y));
}
【问题讨论】:
标签: algorithm cuda opencl computational-geometry gpgpu