【问题标题】:what are the differences between Multi thread Execution and Parallelization with respect to Job performance in Talend?多线程执行和并行化在 Talend 中的作业性能方面有什么区别?
【发布时间】:2023-05-04 14:26:01
【问题描述】:

多线程执行

并行化

【问题讨论】:

  • 我也对此感兴趣。我有 5 年的 talend 经验,但不知道多线程有什么作用,如果它有什么作用的话。
  • 这可能会提供一些线索。如果您不将它们连接在一起,基本上多线程让 talend 并行触发子作业。 help.talend.com/display/TalendDataFabricStudioUserGuide61EN/…
  • 我已经去过那个...

标签: talend talend-mdm


【解决方案1】:

当线程数(通常一个子作业计数一个线程)不超过您用于并行执行的机器的处理器数时,多线程是最佳选择。否则,某些子作业必须等到任何处理器被释放。

另外请注意,并行化的 CPU 数量不能超过 CPU 数量,否则它将等待处理器,并且会增加处理器的开销。

并行化可帮助您管理复杂的作业系统。它同时执行多个子作业,并将一个子作业的执行与主作业中的其他子作业同步。

以上两者之间的确切区别是并行化(或启用多线程)链接的子作业并行运行,无论哪个先完成,另一方面,同步链接的子作业仅在所有其他并行化子作业时才开始运行完成。

因此,当您的请求需要一些子作业并行运行时,并行化是最佳选择,并且只有在所有其他并行化子作业完成时子作业才开始运行。

这也让你的工作设计更加灵活。

详细信息可以访问link

【讨论】:

    最近更新 更多