【发布时间】:2012-08-02 07:47:13
【问题描述】:
我正在使用 jdk 7 的新 forkjoin 框架。 我有一个任务,必须使用不同的参数执行多次。
此任务扩展RecursiveTask。有100多个任务要执行,可以同时执行。这些任务是独立的,因此不需要任何同步。
因此,我首先创建了所需的任务并将它们传递给 forkjoin 线程池。
但是应用程序变得比没有任何并行性的情况下运行它要慢。
我的第一个想法是,我创建了很多线程。这就是为什么我尝试回收线程以减少对象创建开销,但这对性能没有影响。使用 reinitialize() 方法回收 im。此外,通过回收,性能比没有任何并行性的情况下运行要慢。
任务中执行的操作不是微不足道的,运行线程的持续时间从 5 到 150 毫秒。该应用程序在双核机器上运行,我使用 ubuntu 和 oracle jdk 7。
【问题讨论】:
-
您是否构建了一个简单的程序,它只是简单地分叉一个任务并等待它完成,线程做零工作,以了解上下文切换时间?你知道那是什么时候吗?
-
...您会注意到使用 2 个处理器时,您的加速比最多为 2 倍。您确定需要 100 个独立任务吗?
-
我会尝试你的第一条评论 :) 如上所述,我不再使用 100 个独立线程。我创建了固定数量的线程,它们是扩展 RecursiveTask
的对象,如许多示例所示,例如2. 然后我设置这些对象的参数并将它们传递给池,以同时运行。之后我重新设置参数,只要元素可用,就必须执行任务。 -
5 到 150 毫秒的持续时间还不够,要使用线程吗?
-
与管理并行性相比,重要的是您可以完成的工作量。如果分叉需要 50 毫秒,而你有 50 毫秒的工作要做,那么你的效率只有 50%。与一个 CPU 相比,使用两个 CPU 最多可以达到收支平衡。因此,了解您的开销很重要。我不知道 Java 分叉需要这么长时间(根本没有经验),这对我来说似乎是一个不合理的高数字。因此建议对其进行测量。
标签: java multithreading performance parallel-processing fork-join