大数据生态之zookeeper（原理）

1. 集群的角色描述：

2. zookeeper的选主过程

(1)全新集群的选主：

根据启动的顺序和id进行选主(过半机制：集群中超过半数的集群可使用时，才开始选主)

以hadoop01(id=1)—hadoop02(id=2)---hadoop03(id=3)----hadoop04(id=r)----hadoop05(id=5)为例：

当hadoop01启动时，此时只有它一台服务器，，他发出取的报告没有任何相应，所有它的选举一直是looking状态。

Hadoop02启动：它与最开始启动的hadoop01进行通信，相互交换自己的选举结果，由于两者都没有历史数据，所以id值较大的服务器胜出，但是由于没有达到超过半数以上的服务器同意选举它(这个例子中的半数以上是 3)，所有hadoop01、hadoop02还是继续保持looking状态。

Hadoop03启动，根据前面的分析，服务器 3 成为服务器 1,2,3 中的老大，而与上面不同的是，此时有三台服务器(超过半数)选举了它，所Hadoop03它成为了这次选举的 leader

服hadoop04启动，根据上面的分析，理论上，hadoop04应该是服务器中id最大的，但是由前面已近有超过半数的服务器选举了hadoop03，所以hadoop04只能是follower

Hadoop05启动，与hadoop04一样，也是follower

zookeeper server的三种工作状态：

LOOKING：当前 Server 不知道 leader 是谁，正在搜寻，正在选举

LEADING：当前 Server 即为选举出来的 leader，负责协调事务

FOLLOWING：leader 已经选举出来，当前 Server 与之同步，服从 leader 的命令

(2)非全新集群的选主

leader 已经选举出来，当前 Server 与之同步，服从 leader 的命令，但是由于某种原因主节点宕机：

此时我们根据三个维度来选主：数据version、serverid、逻辑时钟。

数据version：数据新的version就大，数据每次更新，同时会更新它的version

Serverid：就是我们配置的 myid 中的值，每个机器一个

逻辑时钟：这个值从0开始，每一次选举对应一个值，也就是说，如果在同一次选举中，这个值应该一致，逻辑时钟越大，说明这一次选举leader人的进程更新，也就是每次选举拥有一个 zxid，投票结果只取 zxid 最新的

选举的标准：

逻辑时钟小的选举结果被忽略，重新投票

统一逻辑时钟后数据version大的胜出

逻辑时钟统一，version也相同，，server id 大的胜出。

根据以上的规则，快速选出集群的主节点。

3. zookeeper写数据的流程：

客户端发送写入数据的请求，这个请求最终会被leader处理

leader会先写入数据，写入完成之后通知follower进行数据的同步

follower就会开始进行数据的同步(并行，多台follower并行同步)

每一个follower只要数据同步完成就会向leader发送数据同步成功信息

leader接收到超过半数以上的成功信息后，则认为这次写数据成功

其他节点慢慢进行同步，在数据同步的过程中，不对外提供读写服务

4. zookeeper的数据的同步过程

follower连接leader并发送自己最大的zixd

leader进行对比，将自己最大的zxid和follower发送过来的zxid进行对比，如果leader的zxid大于follower的，则通知follower进行数据同步

follower发送数据同步请求

leader确定当前的follower的数据同步点(从follower最大的zxid到leader最大的zxid之间数据需要同步)

follower开始同步数据，这个过程不对外提供读写服务。

follower同步完成，发送消息给leader

leader就会修改当前的follower的状态为update，这个时候follower就可以接受客户端的读写请求，但是只能读，如果是写入请求，需要转发给leader

5. ZooKeeper 中各个角色的工作职责

(1)Leader

恢复数据

维持与follower的心跳，接收follower请求并判断follower的请求消息类型

根据不同的消息类型，进行不同的处理

(2)follower

向leader发送请求(同步数据，写入请求)

接收leader的消息并进行相应的处理

接收client的读写请求，如果是写入的请求转发给leader处理

返回client的读请求，查询的结果

作者：爱学习的小明-1993

来源：CSDN

时间:2019-02-16 23:13 来源: 转发量:次

声明：本站部分作品是由网友自主投稿和发布、编辑整理上传，对此类作品本站仅提供交流平台，转载的目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品，请与我们取得联系，我们会及时修改或删除。

上一篇：TensorFlow object_detect 修改配置文件进行数据增强处
下一篇：太厉害了：居然有人将各大编程语言绘成了一部

网友评论：

发表评论

最新评论 进入详细评论页>>