【发布时间】:2016-12-14 01:54:19
【问题描述】:
我在 Spark 中进行了一些检测,我意识到我的一些任务需要很长时间才能完成,因为可以从 TaskMetrics 中提取调度程序延迟时间。 我知道已经有一些关于这个主题的问题,比如What is scheduler delay in spark UI's event timeline,但答案还没有被接受,它说等待开放槽的任务被认为是调度程序延迟,我认为这不是真的(据我所知如果一个任务没有一个执行器的槽,它就不会开始生成指标)。
我对这个延迟真正从哪里开始有点困惑。我想知道这个延迟时间是否也考虑到应用程序被 YARN 客户端接受和提交应用程序的第一个作业之间的时间段。或者换句话说,在应用被接受的那一刻之间:
这个正在运行:
【问题讨论】: