【问题标题】:cuSOLVER automatically parallelizes computation on many matrices?cuSOLVER 自动并行计算许多矩阵?
【发布时间】:2018-07-27 14:06:21
【问题描述】:

我必须进行相同的计算(例如,获取A1, A2, ... 的特征值)on many(>10^15) 矩阵,所以我希望尽可能多地使用线程。

但我找不到说明线程数的 cuBLAS 或 cuSOLVER 代码。如果我使用 for 循环和 cuSOLVER 函数编写代码,cuSOLVER 会自动分配资源并并行化计算吗?
或者是否有任何 cuSOLVER 或 cuBLAS API 可以控制线程数和并行化函数? ......

【问题讨论】:

    标签: cuda gpu cusolver


    【解决方案1】:

    如果我使用 for 循环和 cuSOLVER 函数编写代码,cuSOLVER 会自动分配资源和并行计算吗?

    没有。

    或者是否有任何 cuSOLVER 或 cuBLAS API 可以控制线程数和并行化函数?

    没有。

    但是,如果您愿意阅读 CUSOLVER documentation,您会看到有一个批处理稀疏 QR 分解例程。 This可以用来解决eigenvalue problems

    【讨论】:

    • 批量二维码分解真的很难理解。 “批处理”到底是什么意思?如果我“批量”处理 M NxN 矩阵,GPU 会并行求解 MNxMN 矩阵或 NxN 矩阵,还是只一个一个地求解?我可以进行自定义“批处理”操作吗?
    • 如果您提交一批 N 个矩阵,它将使用所有可用的 GPU 计算能力以最有效的方式计算 N 个分解。至于其他的,我不知道那是什么意思。你问的是特征值,这就是我的回答所描述的
    猜你喜欢
    • 1970-01-01
    • 2021-02-11
    • 2020-05-18
    • 1970-01-01
    • 2011-04-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-11-26
    相关资源
    最近更新 更多