【发布时间】:2020-10-14 02:21:17
【问题描述】:
我已经使用 Hybridizer 构建了一个程序,用 C# 编写 CUDA 代码并调用函数。该程序可以正常运行,但我注意到设置 GPU 和调用函数的开销非常高。例如,在 CPU 上运行时需要 3000 个滴答的作业需要大约 5000 万个滴答来设置 GPU 包装器,然后在 GPU 上运行时需要另外 5000 万个滴答。我试图弄清楚这种滞后是由于 Hybridizer 本身造成的,还是在从我的 C# 程序调用 GPU 代码时是不可避免的。
所以我正在寻找替代方法。我的搜索发现提到了一些名为 P/invoke 的东西,但我真的找不到关于如何使用它的好指南,而且所有这些线程都有 9 年以上的历史,所以我不知道他们的信息是否仍然相关.我还发现了一些关于 ManagedCuda 的信息,但它似乎不再处于开发阶段。
【问题讨论】: