Zookeeper务的区别解析-Zookeeper-集群中大多数的机器得到响应并接受选出的Leader
Zookeeper和YARN:两大服务的区别解析
Zookeeper和YARN是两个在分布式系统中非常重要的服务,它们各有特点和作用。下面,我们就来聊聊它们的主要区别。
一、定位不同
YARN(Yet Another Resource Negotiator)是一个分布式资源管理器,它的主要任务是提高资源利用率,也就是多类程序的资源分配。而Zookeeper是一个分布式协调服务,可以说是为某一类程序提供服务的。
YARN | Zookeeper |
---|---|
分布式资源管理器 | 分布式协调服务 |
实现“一个集群多个框架” | 提供协调服务 |
YARN就像一个“总管家”,它可以在一个集群上部署多个计算框架,比如Hadoop、Spark等,并为这些框架提供资源调度管理服务。
Zookeeper则更像是一个“指挥官”,它通过一个leader和多个follower组成的集群,为用户的分布式应用程序提供协调服务。
二、作用不同
YARN的主要作用是统筹资源调度,确保任务顺利执行。它可以调度磁盘空间、内存和通讯带宽等资源,实现集群资源共享和弹性收缩。
ZooKeeper的价值在于实现基于分布式的统一化配置管理、命名服务、状态同步等。它通过树状的文件存储系统,保证各个子节点在操作时的同步。
延伸阅读
一、ZooKeeper的基本运转流程:
- 选举Leader。
- 同步数据。
- Leader要具有较高的执行ID,类似root权限。
- 集群中大多数的机器得到响应并接受选出的Leader。
二、YARN的工作流程:
- 用户向YARN中提交应用程序。
- ResourceManager为该应用程序找到一个可用的NodeManager并分配一个Container,然后在这个Container中启动应用程序的ApplicationMaster。
- ApplicationMaster向ResourceManager进行注册,用户可以通过ResourceManager查看应用程序的运行状态并对任务进行监控。
- ApplicationMaster采用轮询的方式通过RPC协议向ResourceManager申请和领取资源。
- ApplicationMaster申请到资源后与对应的NodeManager通信,要求它启动Container并为任务设置好运行环境。
- 应用程序的任务开始在启动的Container中运行,各个任务向ApplicationMaster汇报自己的状态和进度。
- 应用在运行的过程中,客户端通过轮询的方式主动与ApplicationMaster通信以获得应用的运行状态、执行进度等信息。
- 应用程序运行完成后,ApplicationMaster向ResourceManager注销并关闭自己。
Zookeeper和YARN在分布式系统中各有其独特的价值,它们共同为我们的应用程序提供稳定的运行环境。
工具推荐
Worktile:50万+团队都在用的项目协作工具。一个工具满足团队所需:任务、项目、文档、IM、目标、日历、甘特图、工时、审批以及更多,让工作更简单。