【发布时间】:2020-10-09 00:58:45
【问题描述】:
所以你得到一个内核并编译它。您将cl_buffers 设置为参数,然后将clSetKernelArg 两者放在一起。
然后您将内核排入队列以运行并读回缓冲区。
现在,主机程序如何告诉 GPU 指令要运行。例如我正在使用带有 Radeon Pro 460 的 2017 MBP。在汇编级别,在主机进程中调用了哪些指令来告诉 GPU“这就是你要运行的内容”。什么机制可以让 GPU 读取cl_buffers?
事实上,如果你能指出我对所有这些的详细解释,我会非常高兴。我是一名工具链工程师,我对 GPU 编程的工具链方面很好奇,但我发现很难在上面找到好的资源。
【问题讨论】: