【发布时间】:2017-10-18 22:02:10
【问题描述】:
我不明白为什么英特尔 MPI 使用 DAPL,如果原生 ibverb 比 DAPL 更快,那么 OpenMPI 使用原生 ibverb。 然而,在这个基准测试中,IntelMPI 取得了更好的性能。
http://www.hpcadvisorycouncil.com/pdf/AMBER_Analysis_and_Profiling_Intel_E5_2680.pdf
【问题讨论】:
-
Brayme,为什么 DAPL 比原生 ibverbs 慢?对于什么硬件,这个事实的来源是什么? DAPL 可能仅适用于某些版本的英特尔 MPI 和某些硬件(以及某些 other interfaces may be supported:psm、hfi、libfabric、scif 等)。有更新的基准吗?你的任务是什么?
-
我在这里读到advancedclustering.com/act_kb/mpi-over-infiniband,它说英特尔 MPI 使用 DAPL 并且比 OpenMPI 慢,但在 AMBER_Analysis 的这个基准测试中,英特尔 MPI 比 OpenMPI 快。我需要了解 MPI 如何在 Infiniband 上工作,尤其是从这两个库中,因为它与 OFED 相关,我的论文就是关于这个,但我无法理解。
-
advancedclustering.com/act_kb/mpi-over-infiniband 的“这里”已经过时了。没有说明日期,但它是关于旧图书馆的,在某些情况下可能是错误的。是的,如果有
dapl,英特尔 MPI 将使用它。但是我们需要一些微基准(不是复杂的 AMBER)来比较相同硬件上不同大小的消息的实际延迟与 IntelMPI 和 DAPL;使用 OFA(OFED 动词);与 OFI;和 OpenMPI,它支持不同的选项。如果您需要了解某些内容,请尝试阅读真实的 docs/srcs;做测试,只在这里问具体问题。
标签: openmpi infiniband intel-mpi