【发布时间】:2018-07-27 14:06:21
【问题描述】:
我必须进行相同的计算(例如,获取A1, A2, ... 的特征值)on many(>10^15) 矩阵,所以我希望尽可能多地使用线程。
但我找不到说明线程数的 cuBLAS 或 cuSOLVER 代码。如果我使用 for 循环和 cuSOLVER 函数编写代码,cuSOLVER 会自动分配资源并并行化计算吗?
或者是否有任何 cuSOLVER 或 cuBLAS API 可以控制线程数和并行化函数?
......
【问题讨论】: