行业报告 AI展会 数据标注 标注供求
数据标注数据集
主页 > 数据挖掘 正文

大数据生态之zookeeper(原理)

1. 集群的角色描述:

 

 

 

 

2. zookeeper的选主过程

(1)全新集群的选主:

根据启动的顺序和id进行选主(过半机制:集群中超过半数的集群可使用时,才开始选主)

以hadoop01(id=1)—hadoop02(id=2)---hadoop03(id=3)----hadoop04(id=r)----hadoop05(id=5)为例:

当hadoop01启动时,此时只有它一台服务器,,他发出取的报告没有任何相应,所有它的选举一直是looking状态。

Hadoop02启动:它与最开始启动的hadoop01进行通信,相互交换自己的选举结果,由于两者都没有历史数据,所以id值较大的服务器胜出,但是由于没有达到超过半数以上的服务器同意选举它(这个例子中的半数以上是 3),所有hadoop01、hadoop02还是继续保持looking状态。

Hadoop03启动,根据前面的分析,服务器 3 成为服务器 1,2,3 中的老大,而与上面不 同的是,此时有三台服务器(超过半数)选举了它,所Hadoop03它成为了这次选举的 leader

服hadoop04启动,根据上面的分析,理论上,hadoop04应该是服务器中id最大的,但是由前面已近有超过半数的服务器选举了hadoop03,所以hadoop04只能是follower

Hadoop05启动,与hadoop04一样,也是follower

zookeeper server的三种工作状态:

LOOKING:当前 Server 不知道 leader 是谁,正在搜寻,正在选举

LEADING:当前 Server 即为选举出来的 leader,负责协调事务

FOLLOWING:leader 已经选举出来,当前 Server 与之同步,服从 leader 的命令

(2)非全新集群的选主

leader 已经选举出来,当前 Server 与之同步,服从 leader 的命令,但是由于某种原因主节点宕机:

此时我们根据三个维度来选主:数据version、serverid、逻辑时钟。

数据version:数据新的version就大,数据每次更新,同时会更新它的version

Serverid:就是我们配置的 myid 中的值,每个机器一个

逻辑时钟:这个值从0开始,每一次选举对应一个值,也就是说,如果在同一次选举中,这个值应该一致,逻辑时钟越大,说明这一次选举leader人的进程更新,也就是每次选举拥有一个 zxid,投票结果只取 zxid 最新的

选举的标准:

逻辑时钟小的选举结果被忽略,重新投票

统一逻辑时钟后数据version大的胜出

逻辑时钟统一,version也相同,,server id 大的胜出。

根据以上的规则,快速选出集群的主节点。

3. zookeeper写数据的流程:

客户端发送写入数据的请求,这个请求最终会被leader处理

leader会先写入数据,写入完成之后通知follower进行数据的同步

follower就会开始进行数据的同步(并行,多台follower并行同步)

每一个follower只要数据同步完成就会向leader发送数据同步成功信息

leader接收到超过半数以上的成功信息后,则认为这次写数据成功

其他节点慢慢进行同步,在数据同步的过程中,不对外提供读写服务

4. zookeeper的数据的同步过程

follower连接leader并发送自己最大的zixd

leader进行对比,将自己最大的zxid和follower发送过来的zxid进行对比,如果leader的zxid大于follower的,则通知follower进行数据同步

follower发送数据同步请求

leader确定当前的follower的数据同步点(从follower最大的zxid到leader最大的zxid之间数据需要同步)

follower开始同步数据,这个过程不对外提供读写服务。

follower同步完成,发送消息给leader

leader就会修改当前的follower的状态为update,这个时候follower就可以接受客户端的读写请求,但是只能读,如果是写入请求,需要转发给leader

5. ZooKeeper 中各个角色的工作职责

(1)Leader

恢复数据

维持与follower的心跳,接收follower请求并判断follower的请求消息类型

根据不同的消息类型,进行不同的处理

(2)follower

向leader发送请求(同步数据,写入请求)

接收leader的消息并进行相应的处理

接收client的读写请求,如果是写入的请求转发给leader处理

返回client的读请求,查询的结果

作者:爱学习的小明-1993

来源:CSDN

微信公众号

声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
SEM推广服务

Copyright©2005-2028 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注

扫码入群
扫码关注

微信公众号

返回顶部