【问题标题】:Incorrect result with too many threads线程过多导致结果不正确
【发布时间】:2015-03-02 22:25:30
【问题描述】:

这是一个看似简单的类,用于对数组中的所有元素求和:

class ArraySum
{
    class SumRange
    {
        int left;
        int right;
        int[] arr;
        public int Answer { get; private set; }

        public SumRange(int[] a, int l, int r)
        {
            left = l;
            right = r;
            arr = a;
            Answer = 0;
        }

        public void Run()
        {
            if (right - left == 1)
            {
                Answer = arr[left];
            }
            else
            {
                SumRange leftRange = new SumRange(arr, left, (left + right) / 2);
                SumRange rightRange = new SumRange(arr, (left + right) / 2, right);

                Thread leftThread = new Thread(leftRange.Run);
                Thread rightThread = new Thread(rightRange.Run);
                leftThread.Start();
                rightThread.Start();
                leftThread.Join();
                rightThread.Join();

                Answer = leftRange.Answer + rightRange.Answer;
            }
        }
    }

    public static int Sum(int[] arr)
    {
        SumRange s = new SumRange(arr, 0, arr.Length);
        s.Run();
        return s.Answer;
    }
}

当然,这不是执行此任务的有效方式。这也是线程的非常低效的使用。编写本课程是为了说明一个基本的分而治之的解决方案概念,并且希望能够做到这一点。

这里也是这个类的一个简单的单元测试:

public void should_calculate_array_sum()
{
    int N = 1000;
    int[] arr = System.Linq.Enumerable.Range(0, N).ToArray();

    int sum = ArraySum.Sum(arr);

    Assert.AreEqual(arr.Sum(), sum);
}

这就是问题所在。当 N 设置为 1000 时,此测试在我的机器上失败了大约 5 次(共 5 次),实际结果小于预期。当 N 为 100 及以下时 - 它永远不会失败,或者至少我从未见过它失败。

为什么这个程序会失败?这显然是一种非常低效的方法,线程管理的开销太大,但至少它应该总是正常工作,对吧?要么有一些我看不到的细微错误,要么有一些我不理解的线程概念。

另外,我不是在寻找更好的方法来解决这个特定的问题,也不是在寻找更好的方法来说明相同的概念。我只是想弄清楚为什么这种特殊方法有时会失败。

【问题讨论】:

  • 注意:好问题,重现失败的测试。使用多线程完成的计算确实更小并且不遵循模式(pastebin.com/XscPFZYA
  • 您写到至少它应该产生正确的结果,但是您的程序创建了太多线程。您应该更早地考虑不分区,而不是以递归方式创建线程。
  • 您正在创建数百个线程,所有线程都带有编组给它们的数组副本。您可能内存不足。更小的数组 = 足够的内存不会死。
  • @dotnetstep,对,我知道在一定的递归深度切换到非线程方法会成功。问题是 - 为什么它不能像现在这样产生正确的答案。
  • @Tim,从未出现内存不足异常。不是所有线程都共享对数组的相同引用吗?

标签: c# multithreading


【解决方案1】:

在将 Run 函数包装在 try-catch 中之后,我将这段代码放入控制台应用程序并运行了几次(参见下面的代码)。有几次,当我看到数字不同时,抛出了许多 OutOfMemory 异常。

因此,它似乎取决于运行时如何以及何时分配线程以及它当时可用的资源。详细地说,如果运行时决定分配线程,然后在没有任何线程完成工作的情况下进入下一个时间片,则可以同时启动并运行所有 2000 多个线程(每个线程都被分配1MB 的堆栈空间,以及其他内存资源)。这将很快耗尽您的 2GB 进程内存分配(所有 Windows 32 位进程都有)。

或者,如果它分配一些线程,让它们完成它们的工作然后死掉,然后分配更多线程,你将不会达到如此高的峰值内存并且会成功完成 - 这完全取决于运行时决定如何安排工作。正如其他人所指出的,使用 ThreadPool 将解决该问题,因为它重用了线程。

public void Run()
{
    try
    {
        if (right - left == 1)
        {
            Answer = arr[left];
        }
        else
        {
            SumRange leftRange = new SumRange(arr, left, (left + right) / 2);
            SumRange rightRange = new SumRange(arr, (left + right) / 2, right);

            Thread leftThread = new Thread(leftRange.Run);
            Thread rightThread = new Thread(rightRange.Run);
            leftThread.Start();
            rightThread.Start();
            leftThread.Join();
            rightThread.Join();

            Answer = leftRange.Answer + rightRange.Answer;
        }
    }
    catch(Exception e)
    {
        Console.WriteLine("Error: " + e.Message);
        Debug.WriteLine("Error: " + e.Message);
    }
}

【讨论】:

  • 谢谢。事实上,我已经将代码包装在 try/catch 中并查看 OutOfMemory 异常。这就解释了为什么答案不正确。但是为什么它会被抛出呢?
  • 每个线程至少消耗 1MB 内存。如果您在 32 位应用程序中创建 2,000 个线程,您很容易耗尽内存。
  • @Andrei 我间接引用了它,其他人更明确地指出这是由于资源。如果运行时决定分配线程然后移动到下一个切片,则可以让所有线程同时启动并运行。这将很快耗尽您的 2GB 进程内存分配。或者,如果它分配了一些线程,让它们完成工作然后死掉,您将无法达到峰值内存并成功完成 - 这完全取决于运行时决定如何安排工作。正如其他人所指出的,使用 ThreadPool 将解决问题。
  • 现在一切都加起来了。我的应用程序使用默认设置,因此它是 32 位应用程序,其内存限制为 2 Gb。大约 2000 个线程使用默认的 1 Mb 堆栈大小创建,每个线程快速将其全部填满,导致内存不足异常。感谢 Gjeltema 和@Enigmativity。
  • @Andrei 我和其他人一样,不阅读 cmets。因此,我永远不会阅读您的评论并接受您的建议。等一下……
【解决方案2】:

您没有创建 数百 个线程,甚至 1000 个线程。它可能更像是 2000 个线程。

证明

为了使数学更容易,说 N = 1024。

# bisections  Range  Number of threads
      1       1024     1      (main thread)
      2       512      2
      3       256      4
      4       128      8
      5       64       16
      6       32       32
      7       16       64
      8       8        128
      9       4        256
      10      2        512
      11      1        1024   (individual sum thread)

线程总数 = 1024 + 512 + 256 + ... 4 + 2 + 1 = 2047。显然,并非所有线程都需要同时处于活动状态(当我运行它时,许多线程在计算过程中被杀死),但您肯定创建大约 2000 个线程。


我不是在寻找更好的方法来解决这个特定问题,也不是在寻找更好的方法来说明相同的概念。

如果您想(可能)通过微小的更改来解决您的问题,请遵循我的建议 1。我添加了一些其他方法来做到这一点(TPL,ThreadPool),以防您想以另一种方式(但我很确定这不是你想要做的)。

建议一:减少线程并行化

如果您修改使用线程的方式,例如

Thread leftThread = new Thread(leftRange.Run);
leftThread.Start();
leftThread.Join();

Thread rightThread = new Thread(rightRange.Run);
rightThread.Start();
rightThread.Join();

那么任何给定线程一次只会产生 一个 线程,因此 活动 线程的数量最多为 11 个。

建议 2:使用任务并行库

从 .NET Framework 4 开始,TPL 是编写多线程和并行代码的首选方式

Task Parallel Library 可能是您最好的选择,除非您特别想自己处理线程。

下面的内容远未优化 - 按照我在下面的方式使用 TPL 会产生很多开销,但它演示了该方法。

public void Run()
{
    if ( right - left == 1 )
    {
        Answer = arr[left];
    }
    else
    {
        Answer = new bool[] { true, false }
            .AsParallel()
            .Sum(isLeft =>
                {
                    SumRange sumRange = isLeft
                        ? new SumRange(arr, left, (left + right) / 2)
                        : new SumRange(arr, (left + right) / 2, right);
                    sumRange.Run();
                    return sumRange.Answer;
                });
    }
}

当我运行它时,它非常慢,因为它并行运行两个项目。您可能需要考虑分解成更大的组(例如 10 个)而不是一分为二。回到 N = 1000:

# bisections  Range  Number of threads
      1       1000     1      (main thread)
      2       100      10
      3       10       100
      4       1        1000

这将最大线程数减少到1111,但TPL会大大减少。

建议 3:线程池

我认为您可能应该考虑使用ThreadPool 来创建线程 - 这样,线程的最小数量只有 11(即从二等分 1 到二等分 11 的路径)。我不知道如何使用ThreadPool,但这里有一个看起来很有用的链接:MSDN: How to use a Thread Pool

【讨论】:

  • 感谢您的回复,但请转至 Gjeltema's answer,因为它帮助我理解了问题,这正是我所寻找的。​​span>
  • 没问题。感谢您提出一个有趣的问题!我希望我的回答(至少是关于线程数的第一部分)对您有所帮助。
猜你喜欢
  • 2019-05-29
  • 1970-01-01
  • 2021-11-28
  • 2021-10-05
  • 2018-12-19
  • 1970-01-01
  • 2021-08-07
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多