Yarn基本架构

YARN主要由ResourceManager、NodeManager、ApplicationMaster(AM)和Container等组件构成。

Yarn工作机制

Yarn简介
1.MapReduce程序提交到客户端所在的节点。
2.Yarnrunner向ResourceManager申请一个Application。
3.RM将该应用程序的资源路径返回给yarnrunner。
4.该程序将运行所需资源提交到HDFS上。
5.程序资源提交完毕后,申请运行mrAppMaster。
6.RM将用户的请求初始化成一个task。
7.其中一个NodeManager领取到task任务。
8.该NodeManager创建容器Container,并产生MRAppmaster。
9.Container从HDFS上拷贝资源到本地。
10.MRAppmaster向RM 申请运行maptask资源。
11.RM将运行maptask任务分配给另外两个NodeManager,另两个NodeManager分别领取任务并创建容器。
12.MR向两个接收到任务的NodeManager发送程序启动脚本,这两个NodeManager分别启动maptask,maptask对数据分区排序。
13.MrAppMaster等待所有maptask运行完毕后,向RM申请容器,运行reduce task。
14.reduce task向maptask获取相应分区的数据。
15.程序运行完毕后,MR会向RM申请注销自己。

资源调度器

Hadoop作业调度器主要有三种:FIFO、Capacity Scheduler和Fair Scheduler。

FIFO(先进先出调度器)

按照到达时间排序,先到先服务。

Capacity Scheduler(容量调度器)

支持多个队列,每个队列采用FIFO策略。

Fair Scheduler(公平调度器)

支持多个队列,每个队列中job优先级越高分配资源也越多,每个队列中多个作业同时运行。

相关文章:

  • 2021-04-29
  • 2021-07-06
  • 2021-07-18
  • 2021-07-28
  • 2021-06-16
  • 2021-05-15
  • 2021-10-26
  • 2022-01-18
猜你喜欢
  • 2021-04-21
  • 2021-11-02
  • 2021-10-25
  • 2021-04-04
  • 2021-04-25
  • 2021-09-03
  • 2022-12-23
相关资源
相似解决方案