【问题标题】:BLAS Library BenchmarkBLAS 库基准
【发布时间】:2008-11-25 19:50:27
【问题描述】:

是否有比较不同 BLAS(基本线性代数子程序)库的基准?我对单核和多核系统的稀疏矩阵乘法特别感兴趣?

【问题讨论】:

    标签: benchmarking multicore blas


    【解决方案1】:

    BLAS 性能在很大程度上取决于系统,因此您最好自己在要使用的机器上进行基准测试。由于只有少数 BLAS 实现,因此工作量比听起来要少(通常是 hardware vendors implementationATLASGOTO BLAS)。

    但请注意,BLAS 仅涵盖密集矩阵,因此对于稀疏矩阵乘法,您需要 Sparse-BLAS 或其他代码。这里的性能不仅取决于硬件,还取决于您要使用的稀疏格式,甚至取决于您正在使用的矩阵类型(稀疏模式、带宽等问题)。因此,即使在密集的情况下,如果您需要最高性能,您将需要进行自己的基准测试。

    【讨论】:

    • 我尝试在 Linux 系统上使用 Intel Math Kernel Library 进行基准测试,但遇到了仅适用于特定版本的 gcc 的问题。仅此一项就花费了我一天的工作时间。另一方面,我不知道性能增益将在哪个数量级......
    猜你喜欢
    • 2011-11-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-11-01
    • 2011-02-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多