当前位置:网站首页 > R语言数据分析 > 正文

yarn提交任务命令(yarn中的任务有)



一个MR应用提交运行到Hadoop YARN上时,包含两个部分:应用管理者AppMaster和运行应用进程Process(如MapReduce程序MapTask和ReduceTask任务),如下图所示:

当一个Spark应用提交运行在集群上时,应用架构有两部分组成:Driver Program(资源申请和调度Job执行)和Executors(运行Job中Task任务和缓存数据),都是JVM Process进程:

而Driver程序运行的位置可以通过--deploy-mode 来指定,值可以是:

1.client:表示Driver运行在提交应用的Client上(默认)

2.cluster:表示Driver运行在集群中(Standalone:Worker,YARN:NodeManager)

Spark On Yarn两种模式的任务提交流程

DeployMode为Client,表示应用Driver Program运行在提交应用Client主机上,示意图如下:

运行圆周率PI程序,采用client模式,命令如下:

http://node1:8088/cluster

DeployMode为Cluster,表示应用Driver Program运行在集群从节点某台机器上,示意图如下:

运行圆周率PI程序,采用cluster模式,命令如下:

结果查看:http://node1:8088/cluster

进入8088yarn应用目录

Client模式和Cluster模式最最本质的区别是:Driver程序运行在哪里。

Client模式:学习测试时使用,开发不用,了解即可

  1.Driver运行在Client上,和集群的通信成本高

  2.Driver输出结果会在客户端显示

Cluster模式:生产环境中使用该模式

  1.Driver程序在YARN集群中,和集群的通信成本低

  2.Driver输出结果不能在客户端显示

  3.该模式下Driver运行ApplicattionMaster这个节点上,由Yarn管理,如果出现问题,yarn会重启ApplicattionMaster(Driver)

在YARN Client模式下,Driver在任务提交的本地机器上运行,示意图如下:

具体流程步骤如下:

1)、Driver在任务提交的本地机器上运行,Driver启动后会和ResourceManager通讯申请启动ApplicationMaster;

2)、随后ResourceManager分配Container,在合适的NodeManager上启动ApplicationMaster,此时的ApplicationMaster的功能相当于一个ExecutorLaucher,只负责向ResourceManager申请Executor内存;

3)、ResourceManager接到ApplicationMaster的资源申请后会分配Container,然后ApplicationMaster在资源分配指定的NodeManager上启动Executor进程;

4)、Executor进程启动后会向Driver反向注册,Executor全部注册完成后Driver开始执行main函数;

5)、之后执行到Action算子时,触发一个Job,并根据宽依赖开始划分Stage,每个Stage生成对应的TaskSet,之后将Task分发到各个Executor上执行。

在YARN Cluster模式下,Driver运行在NodeManager Contanier中,此时Driver与AppMaster合为一体,示意图如下:

 具体流程步骤如下:

1)、任务提交后会和ResourceManager通讯申请启动ApplicationMaster;

2)、随后ResourceManager分配Container,在合适的NodeManager上启动ApplicationMaster,此时的ApplicationMaster就是Driver;

3)、Driver启动后向ResourceManager申请Executor内存,ResourceManager接到ApplicationMaster的资源申请后会分配Container,然后在合适的NodeManager上启动Executor进程;

4)、Executor进程启动后会向Driver反向注册;

5)、Executor全部注册完成后Driver开始执行main函数,之后执行到Action算子时,触发一个job,并根据宽依赖开始划分stage,每个stage生成对应的taskSet,之后将task分发到各个Executor上执行;

到此这篇yarn提交任务命令(yarn中的任务有)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • springboot文件服务器搭建(spring boot 文件服务)2025-09-18 07:09:08
  • ruinita手表价格及图片(ruinita手表怎么样)2025-09-18 07:09:08
  • resnet50作者(resnet50原理)2025-09-18 07:09:08
  • win10vcruntime140.dll无法继续执行代码(vcruntime140.dll,无法继续执行代码)2025-09-18 07:09:08
  • ldr指令全称(ldr指令用法)2025-09-18 07:09:08
  • seater英语怎么读(seaturtle英语怎么读)2025-09-18 07:09:08
  • docker启动文件(docker打开文件)2025-09-18 07:09:08
  • ueditor编辑器网页版(ueditor官网没了)2025-09-18 07:09:08
  • emr+apc是什么意思(emr是什么意思啊)2025-09-18 07:09:08
  • Tornadoes.(Tornadoes专四听力)2025-09-18 07:09:08
  • 全屏图片