【问题标题】:OpenCL/GL interop: write_imagef to shared gltexture is all white (1,1,1,1)OpenCL/GL 互操作:共享 gltexture 的 write_imagef 全白 (1,1,1,1)
【发布时间】:2026-01-13 04:30:01
【问题描述】:

我正在尝试使用 OpenCL 编写光线追踪器。然而,我遇到了一些麻烦。

我想在 OpenGL 和 OpenCL 之间共享纹理内存以避免不必要的内存来回复制。我的程序运行良好,每次调用 GL 和 CL 后我都会检查,我没有收到任何错误。

如标题中所述,使用 write_imagef 写入内核中的纹理会导致每个通道中的 1.0。

我怀疑纹理格式有问题,但我一直在互联网上寻找有效的纹理格式,但看不出有什么问题。我尝试了 write_imageui 和 write_imagef 以及纹理格式的不同组合,但没有成功。

内核程序:

__kernel void Draw( __global __write_only image2d_t image, const int width, const int height )
{
    int x = get_global_id(0);
    int y = get_global_id(1);
    // Write some red color
    write_imagef(image, (int2)(x,y), (float4)(1.0f,0.0f,0.0f,1.0f));
}

我已通过将代码修改为

来确认我的内核正在运行
if(x < width/2)
    write_imagef(image, (int2)(x,y), (float4)(1.0f,0.0f,0.0f,1.0f));

并将我的纹理初始化为一种颜色(绿色)。结果:半白半绿的纹理,这意味着内核正在写入图像应该在哪里(但不是正确的值)。

创建我的纹理并创建 cl_mem 对象:

// Create OpenGL Texture
GLuint textureID;
glGenTextures( 1, &textureID );
glBindTexture( GL_TEXTURE_2D, textureID );
glTexImage2D( GL_TEXTURE_2D, 0, GL_RGBA, imageWidth, imageHeight, 0, GL_RGBA, GL_FLOAT, nullptr );
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MAG_FILTER, GL_LINEAR);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_LINEAR);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_WRAP_S, GL_CLAMP);
glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_WRAP_T, GL_CLAMP);

// Create OpenCL memobject from gl texture
cl_mem textureMem = clCreateFromGLTexture2D( context, CL_MEM_WRITE_ONLY, GL_TEXTURE_2D, 0, textureID, &ret );

执行内核并渲染纹理:

// Main loop
...

// Set kernel args
ret = clSetKernelArg( kernel, 0, sizeof(cl_mem), (void *)&textureMem );
ret = clSetKernelArg( kernel, 1, sizeof(int), (void *)&imageWidth );
ret = clSetKernelArg( kernel, 2, sizeof(int), (void *)&imageHeight );

cl_event event[3];
// Aquire texture
ret = clEnqueueAcquireGLObjects( commandQueue, 1, &textureMem, 0, NULL, &event[0] );

// Execute kernel
size_t globalWorkSize[] = {imageWidth, imageHeight};
size_t localWorkSize[] = {32,32};
ret = clEnqueueNDRangeKernel( commandQueue, kernel, 2, NULL, globalWorkSize, localWorkSize, 1, &event[0], &event[1] );

// Release texture
ret = clEnqueueReleaseGLObjects( commandQueue, 1, &textureMem, 1, &event[1], &event[2] );

clWaitForEvents( 1, &event[2] );

// Render textured quad with OpenGL
glClear( GL_COLOR_BUFFER_BIT );
glUseProgram( quadProgramID );
glBindBuffer( GL_ARRAY_BUFFER, vertexBuffer );
glActiveTexture(GL_TEXTURE0);
glBindTexture( GL_TEXTURE_2D, textureID );
glEnableVertexAttribArray( 0 );
glVertexAttribPointer( 0, 4, GL_FLOAT, GL_FALSE, 0, (void*)0 );
glDrawArrays( GL_TRIANGLE_STRIP, 0, 4 );
glDisableVertexAttribArray( 0 );
glUseProgram(0);
glfwSwapBuffers( window );
glFinish();

我还可以补充一点,我已经成功地能够使用相同的主机程序在内核中发送和处理常规浮点数组。

我希望有人遇到类似的问题,由于我现在完全陷入困境,我不妨把这个问题扔在那里。

如果上面的代码不够相关,这里是完整的源代码http://pastebin.com/LhBhQDSR

感谢您的帮助。

【问题讨论】:

  • 您的 commandQueue 是有序的还是无序的?你是如何渲染图像的?
  • 命令队列是有序的。我添加了将纹理四边形绘制到上方屏幕的代码。
  • 那一定是“渠道顺序”问题。你是如何创建图像对象的?哪个频道顺序?也许不是 CL_RGBA ?我的意思是宿主代码中的 image2dt 对象。

标签: c++ windows opengl interop opencl


【解决方案1】:

这是频道格式的问题。我在创建 glTexture 时将内部格式从 GL_RGBA 更改为 GL_RGBA32F,现在它就像一个魅力。

【讨论】: