【发布时间】:2015-09-01 16:09:37
【问题描述】:
我想计算最佳网格大小和块大小,以便为内核启动提供高占用率。我已经看到CUDA中有一个函数可以做到这一点,就是这个:
cudaOccupancyMaxPotentialBlockSize()
我正在使用 PyCUDA,我想知道 PyCUDA 中是否存在等效函数。
【问题讨论】:
-
使用最大块大小并不总是可以实现最高占用率 - 也就是说,较小的块可能能够实现更高的占用率。
我想计算最佳网格大小和块大小,以便为内核启动提供高占用率。我已经看到CUDA中有一个函数可以做到这一点,就是这个:
cudaOccupancyMaxPotentialBlockSize()
我正在使用 PyCUDA,我想知道 PyCUDA 中是否存在等效函数。
【问题讨论】:
据我所知,驱动程序 API 占用函数,包括 cuOccupancyMaxPotentialBlockSize,在 PyCUDA 中尚未实现,截至版本 2015.1.3,based on a search of the Github mirror。
【讨论】: