MPI_Bcast 动态二维数组答案

【问题标题】：MPI_Bcast a dynamic 2d arrayMPI_Bcast 动态二维数组
【发布时间】：2011-07-03 13:18:48
【问题描述】：

我正在尝试将带有 bcast 的动态二维数组传递给所有等级。我有以下代码。

#include <stdlib.h>
#include <mpi.h>

int main(int argc, char **argv)
{   
    float **array;
    int rank,size,i,j;

    MPI_Init(&argc,&argv);
    MPI_Comm_rank(MPI_COMM_WORLD,&rank);
    MPI_Comm_size(MPI_COMM_WORLD,&size);

    if(rank==0)
    {
        array = (float **)malloc(10*sizeof(float));
        for(i=0;i<10;i++)
            array[i] = (float *)malloc(10*sizeof(float));

        for(i=0;i<10;i++)
        for(j=0;j<10;j++)
            array[i][j]=i+j;
    }
    MPI_Bcast(array,10*10,MPI_FLOAT,0,MPI_COMM_WORLD);
    MPI_Finalize();
}

由于某种原因，我无法理解我得到分段错误。有谁知道问题出在哪里？

【问题讨论】：

@davidb 和@jackn：伙计们，他想要一个带有指向 10 个数组的指针的数组（这些数组应包含浮点数），如果你告诉他 malloc 100*sizeof(float) 你也应该告诉他如何设置行优先或列优先排序的指针。

标签： c mpi

【解决方案1】：

这里有三个问题 - 一个涉及分配，一个涉及分配位置，一个涉及 MPI 的工作原理，其他答案都没有涉及所有这些。

第一个也是最严重的问题是分配的地方。正如@davidb 正确指出的那样，就目前而言，您仅在任务零上分配内存，因此其他任务没有用于接收广播的内存。

至于 C 中的二维分配，您的代码几乎完全正确。在这段代码中：

     array = (float **)malloc(10*sizeof(float));
     for(i=0;i<10;i++)
         array[i] = (float *)malloc(10*sizeof(float));

唯一真正的问题是第一个 malloc 应该是 10 个浮点指针，而不是浮点数：

     array = (float **)malloc(10*sizeof(float *));
     for(i=0;i<10;i++)
         array[i] = (float *)malloc(10*sizeof(float));

@eznme 指出了这一点。第一种方法实际上可能取决于您正在编译/链接的内存模型等，并且几乎肯定会在 32 位操作系统/机器上工作 - 但仅仅因为它工作并不总是意味着它是正确的 :)

现在，最后一个问题是您已经在 C 中声明了一个非常好的二维数组，但这不是 MPI 所期望的。当您拨打此电话时

MPI_Bcast(array,10*10,MPI_FLOAT,0,MPI_COMM_WORLD);

您告诉 MPI 发送 array 指向的 100 个连续浮点数。您注意到库例程无法知道 array 是否是指向 2d 或 3d 或 12d array 开头的指针，或者各个维度是什么；它不知道它是否必须遵循指针，如果这样做了，它也不知道要遵循多少。

所以你想发送一个浮点指针到 100 个连续的浮点数 - 并且在分配伪多维数组 (*) 的正常 C 方式中，你不一定有那个。在此布局中，您不一定知道第二行与第一行的距离——甚至在哪个方向上。所以你真正想做的是这样的：

int malloc2dfloat(float ***array, int n, int m) {

    /* allocate the n*m contiguous items */
    float *p = (float *)malloc(n*m*sizeof(float));
    if (!p) return -1;

    /* allocate the row pointers into the memory */
    (*array) = (float **)malloc(n*sizeof(float*));
    if (!(*array)) {
       free(p);
       return -1;
    }

    /* set up the pointers into the contiguous memory */
    for (int i=0; i<n; i++) 
       (*array)[i] = &(p[i*m]);

    return 0;
}

int free2dfloat(float ***array) {
    /* free the memory - the first element of the array is at the start */
    free(&((*array)[0][0]));

    /* free the pointers into the memory */
    free(*array);

    return 0;
}

这样，也只有这样，才能保证内存是连续的。然后就可以了

float **array;
/* ... */
malloc2dfloat(&array, 10, 10);
if (rank == 0) {
    for(i=0;i<10;i++)
         for(j=0;j<10;j++)
              array[i][j]=i+j;
}
MPI_Bcast(&(array[0][0]), 10*10, MPI_FLOAT, 0, MPI_COMM_WORLD);

请注意，对于任意排列的数据，您仍然可以通过定义一个 MPI 数据类型来执行Bcast，该数据类型描述了二维数组是如何实际在内存中布局的；但这更简单，更接近您可能真正想要的。

(*) 这里真正的问题是 C 和 C 派生的语言没有真正的多维数组作为第一类对象——这对于系统编程语言来说很好，但在进行科学编程时却是不可挽回的恼人。

【讨论】：

或者，可以使用一维缓冲区数组并从 bcasted 缓冲区重新构造 n 维数组

【解决方案2】：

array 应该是 100 而不是 10，因为您为每行分配了 10 个浮点数。 JackN 的答案有执行此操作的代码。

但是，在 rank 0 以外的任何进程上，指向数组的指针将是 null。您需要在所有进程上初始化数组，然后在根上填充数组。

您可以将 malloc 代码移出 if (rank ==0) 块，它应该可以按照您的预期工作。

【讨论】：

【解决方案3】：

数组应该是 100，而不是 10。

array = (float **)malloc(100*sizeof(float));

【讨论】：

你的意思是，如果我想要一个 10x10 的二维数组，我必须分配一个 100x1 的数组？那么我可以像二维数组一样访问它吗？
是的。并摆脱for(i=0;i<10;i++) array[i] = (float *)malloc(10*sizeof(float));在尝试访问不允许的内存位置时发生分段错误。

【解决方案4】：

您可能想将第一个 malloc 更改为

malloc(10*sizeof(void*))

因为数组存储指针并存储浮点数而不是整数：

array[i][j]=1.0;

【讨论】：

【解决方案5】：

如果你想分配一个10*10的数组，你的代码：

array = (float **)malloc(10*sizeof(float))

应该是

array = (float **)malloc(10*sizeof(float*))

【讨论】：