【发布时间】:2019-03-07 08:52:43
【问题描述】:
我有以下用 GLSL 和 HLSL 编写的片段着色器(这里用 HLSL 编写,但实现几乎相同):
sampler2D input : register(s0);
float3 lowerBounds : register(c0);
float3 higherBounds : register(c1);
float4 main(float2 uv : TEXCOORD) : COLOR
{
float4 color = tex2D(input, uv);
float y = clamp(0.299 * color.r + 0.587 * color.g + 0.1140 * color.b, 0.0, 1.0);
float u = clamp(-0.169 * color.r - 0.331 * color.g + 0.5000 * color.b, 0.0, 1.0);
float v = clamp(0.500 * color.r - 0.419 * color.g - 0.0813 * color.b, 0.0, 1.0);
if (((y >= lowerBounds.x && y <= higherBounds.x) && (u >= lowerBounds.y && u <= higherBounds.y)) && (v >= lowerBounds.z && v <= higherBounds.z))
{
color = 0;
}
return color;
}
如您所见,着色器只是检查一个颜色是否在两个 YUV 颜色范围内,如果是,则过滤掉片段。
我知道条件语句可能对性能非常不利,所以我想知道上面是否是“坏”条件的示例和/或可以优化为不使用 if 语句。
编辑:最终优化后的代码如下所示:
sampler2D input : register(s0);
float3 lowerBounds : register(c0);
float3 higherBounds : register(c1);
float4 main(float2 uv : TEXCOORD) : COLOR
{
float4 color = tex2D(input, uv);
float y = clamp(0.299 * color.r + 0.587 * color.g + 0.1140 * color.b + 0.0627, 0.0, 1.0);
float u = clamp(-0.169 * color.r - 0.331 * color.g + 0.5000 * color.b, -0.5, 0.5);
float v = clamp(0.500 * color.r - 0.419 * color.g - 0.0813 * color.b, -0.5, 0.5);
float3 yuv = { y, u, v };
// Calculate and apply mask from background range
float3 mask = step(lowerBounds, yuv) * step(yuv, higherBounds);
color *= 1.0 - (mask.x * mask.y * mask.z);
return color;
}
【问题讨论】:
-
如果语句不是自动出错...着色器是分批执行的,所以如果只有一个像素符合条件,则每隔一个像素就需要等待。但是,等待一个简单的分配指令(例如“color = 0”)通常比进行复杂的乘法或步进函数调用要好...
标签: opengl optimization glsl directx hlsl