【问题标题】:Thread level Parallelism VS Process level Parallelism线程级并行 VS 进程级并行
【发布时间】:2019-01-17 08:06:51
【问题描述】:

我对线程和进程有基本的了解,我想知道为什么每本教科书都讲线程级并行,进程级并行存在吗?线程级并行与进程级并行相比有何优势?

【问题讨论】:

  • 恕我直言,线程并行的最大优点是线程共享相同的地址空间。这使得在线程之间共享数据更简单。这也是最大的缺点,因为它使调试变得困难——哪个线程改变了这个?谁先到?

标签: linux multithreading parallel-processing


【解决方案1】:

简答:性能和编程方便

长答案:

首先,必须考虑两种不同类型的并行:基于任务的并行(或“宏并行”)(例如任务 A 修改一些数据并将结果传递给任务 B)和数据级并行(或“微并行”)(例如,处理大型矩阵或向量的负载分散在多个并行代理之间)。

其次,当考虑并行性时,不同的代理需要交换信息。对于线程级并行性,所有线程都可以访问相同的地址空间,并且通信只是内存访问。 相反,进程级并行性需要特定的进程间通信 (IPC) 手段,以允许进程交换数据。存在几种 IPC 方法(管道、共享内存、套接字等)(例如参见 https://en.wikipedia.org/wiki/Inter-process_communication)。

问题在于这些方法通常具有重要的开销,并且通信可能需要多次耗时的数据副本。这是它们目前几乎没有在单个 proc 上使用的主要原因。但是当考虑在不同的和潜在的远程处理器上运行的进程时,主要使用进程级别的并行性。例如,客户端-服务器应用程序是进程级并行。

在单个处理器上,进程级并行性目前也用于 shell 脚本,作为重用现有程序的一种简单方法。 例如,在 unix 上,像“sort

除了线程级并行的一大优势之外:

1) 通过共享内存的简单快速的通信机制

2) 很好地适应任务级并行性或数据级并行性

3) 易于编程

第 2) 点和第 3) 点可能是最重要的。虽然线程级并行性可以基于独立任务,但速度通常受到限制,并且大多数当前应用程序依赖于数据级并行性,线程很好地适应了这些并行性。公共内存空间使得通信开销非常有限(除了考虑锁时),并且存在非常高效且易于使用的并行化工具(例如 open-MP)

在独立进程上实现这种并行性也是可能的。在考虑使用大型计算器进行高性能计算时,它甚至经常发生。存在一些(粗略的)工具(例如“消息传递接口”),但实现到目前为止比线程级并行更复杂、容易出错且效率更低。

【讨论】:

    【解决方案2】:

    存在进程级并行性。

    但是,Linux 内核不知道线程或进程。它只知道任务。

    Task_parallelism,由进程或线程执行。

    线程是与父任务共享大部分资源(地址空间、mmap、管道、打开文件处理程序、套接字等)的任务。并行性不可避免的问题是资源共享。

    还有一些 Linux API 可以控制线程间共享或不共享多少资源,从而提供更大的灵活性。

    这就是为什么线程级并行更受欢迎的原因,尤其是在为数据库等商业服务器编写的应用程序中。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2019-04-02
      • 1970-01-01
      • 2019-04-19
      • 2017-05-31
      • 1970-01-01
      • 1970-01-01
      • 2011-06-25
      相关资源
      最近更新 更多