面试官经常喜欢问什么zookeeper选主原理、什么CAP理论、什么数据一致性。经常都被问烦了,我就想问问面试官,你自己还会实现一个简单的集群内选主呢?估计大部分面试官自己也写不出来。
本篇使用 Java 和 Netty 实现简单的集群选主过程的示例。
这个示例展示了多个节点通过投票选举一个新的主节点的过程。Netty 用于节点间的通信,而每个节点则负责发起和响应选举消息。
集群选主流程
1.选主流程
咱们且不说zookeeper如何选主,单说人类选主,也是采用少数服从多数的原则。人类选主时,中间会经历如下过程:
- 如果我没有熟悉的或者没找到能力比我强的,首先投给自己一票。
- 随着时间推移,可能后面的人介绍了各自的特点和实力,那我可能会改投给别人。
- 所有人将投票信息放入到统计箱中。
- 最终票数最多的人是领导者。
同样的,zookeeper在选主时,也是这样的流程。假设有五大服务器:
- 服务器1先给自身投票
- 后续起来的服务器2也会投自身一票,然后服务器1观察到服务器2的id比较大,则会改投服务器2
- 后续起来的服务器3也会投自身一票,然后服务1和服务器2发现服务器3的id比较大,则都会改投服务器3。服务器3被确定为领导者。
- 服务器4起来后也会投自身一票,然后发现服务器3已经有3票了,立马改投服务器3。
- 服务器5与服务器4的操作一样。
2.选主协议
在选主过程中采用的是超过半数的协议。在选主过程中,会需要如下几类消息:
- 投票请求:节点发出自己的投票请求。
- 接受投票:其余节点作出判断,如果觉得id较大,则接受投票。
- 选举胜出:当选主节点后,广播胜出消息。
代码实现
下面模拟3个节点的选主过程,核心步骤如下:
(1) 定义消息类型、消息对象、节点信息
(2) 每个节点利用Netty启动Server
(3) 启动后利用Netty发送投票请求
(4) 节点接受到投票请求后,做相关处理
节点在收到消息后,做相关逻辑处理:处理投票请求、处理确认投票、处理选主结果。
处理投票请求:判断是否是否接受投票信息。只有在主节点没确定并且zxId较大时,才发送投票消息。如果接受了投票请求的话,则更新本地的投票逻辑,然后给投票节点发送接受投票的消息
处理确认投票:如果投票消息被接受了,则更新本地的投票逻辑。
处理选主结果:如果收到了选主结果的消息,则更新本地的主节点。
(5) 接受别的节点的投票
这里是比较关键的一步,当确定接受某个节点时,则更新本地的投票数,然后判断投票数是否超过半数,超过半数则确定主节点。同时,再将主节点广播出去。
此时,其余节点接收到选主确认的消息后,都会更新自己的本地的主节点信息。
(6) 广播选主结果
(7) 完整代码
完整代码:https://gitee.com/yclxiao/specialty/blob/master/javacore/src/main/java/com/ycl/election/ElectionHandler.java
总结
本文主要演示了一个简易的多Server的选主过程,以上代码是一个简单的基于Netty实现的集群选举过程的示例。在实际场景中,选举逻辑远比这个复杂,需要处理更多的网络异常、重复消息、并发问题等。