fourinone分布式协调设计解析

云计算 分布式
分布式协同是分布式应用中不可缺少的,通常担任协调者的角色,或者说是将多机协同的职责从分布式应用中独立出来,以减少系统的耦合性和增强扩充性。Apache的Zookeeper, google的Chubby都是分布式协同的实现者。fourinone实际上可以单独当做Zookeeper用,它使用最少的代码实现了Zookeeper的所有功能,并且力图做到功能更强但是使用更简洁。

分布式协同是分布式应用中不可缺少的,通常担任协调者的角色,或者说是将多机协同的职责从分布式应用中独立出来,以减少系统的耦合性和增强扩充性。Apache的Zookeeper, google的Chubby都是分布式协同的实现者。fourinone实际上可以单独当做Zookeeper用,它使用最少的代码实现了Zookeeper的所有功能,并且力图做到功能更强但是使用更简洁。

一、实现原理

fourinone对分布式协同的实现, 是通过建立一个domain,node两层结构的节点信息去完成,domain可以是分类或者包,node可以是具体属性,domain和node都是自己根据需求设计命名,比如可以将domain命名为“a.b.c...”表示一个树型类目。

一个domain下可以有很多个node,每个node只指定一个domain,可以通过domain返回它下面所有的node。

domain不需要单独建立,通常在建立node时,如果不存在domain会自动创建。

如果domain下没有node了,该domain会自动删除。

如果删除domain,该domain下面node也都会删除。

每个node下可以存放一个值,可以是任意对象。

所有的节点信息存放在parkserver里,parkserver提供协同者的功能。如下图所示:

从上图可以看到,其他分布式进程可以通过parkserver的用户接口ParkLocal,对节点进行增加、修改、删除、指定心跳、指定权限等操作,并且结合parkserver提供同步备份、领导者选举、过期时间设置等功能,共同来实现众多分布式协同功能,比如:

1、分布式配置,多个机器的应用公用一个配置信息,并且挂掉能够领导者选举,详细见指南和demo

2、分布式锁,多个机器竞争一个锁,当某个机器释放锁或者挂掉,其他机器可以竞争到锁继续,详细见指南和demo

3、集群管理,集群内机器可以互相感知和领导者选举,详见指南和demo #p# 

二、核心API

ParkLocal核心api说明:

//创建node,可以根据是否需要权限和心跳属性调用不同方法

public ObjectBean create(String domain, Serializable obj);//自动创建node

public ObjectBean create(String domain, String node, Serializable obj);

public ObjectBean create(String domain, String node, Serializable obj, AuthPolicy auth);

public ObjectBean create(String domain, String node, Serializable obj, boolean heartbeat);

public ObjectBean create(String domain, String node, Serializable obj, AuthPolicy auth, boolean heartbeat);

//更新node

public ObjectBean update(String domain, String node, Serializable obj);

//获取node

public ObjectBean get(String domain, String node);

//获取最新node,需要传入旧node进行对照

public ObjectBean getLastest(String domain, String node, ObjectBean ob);

//获取最新domain

public List get(String domain);

//获取最新domain下所有node,需要传入旧的node集合对照

public List getLastest(String domain, List oblist);

//删除node

public ObjectBean delete(String domain, String node);

//强行设置domain可删除

public boolean setDeletable(String domain);

//删除domain及下所有node

public List delete(String domain);

//添加node的事件监听

public void addLastestListener(String domain, String node, ObjectBean ob, LastestListener liser);

//添加domain的事件监听

public void addLastestListener(String domain, List oblist, LastestListener liser); #p# 

三、权限机制:

public ObjectBean create(String domain, String node, Serializable obj, AuthPolicy auth);

通过上面方法创建node时,可以指定一个权限参数,有只读(AuthPolicy.OP_READ)、读写(AuthPolicy.OP_READ_WRITE)、所有(AuthPolicy.OP_ALL)三种属性,默认为AuthPolicy.OP_ALL

注意:这里的权限属性是指创建进程对其他使用进程的权限约束,而不包括它自己。也就是对node的创建进程来说,它拥有对该node和domain所有操作权限(读写删,只要它不退出或者中止)

建设现在创建了一个domain为d,node为n的节点, 对于其他使用进程来说,操作权限如下表所示:

权限\其他进程

读(get)n 写(update)n 删(delete)n 删(delete)d

AuthPolicy.OP_READ

Yes No No No

AuthPolicy.OP_READ_WRITE

Yes Yes No No

AuthPolicy.OP_ALL

Yes Yes Yes No

 

从上表可以发现,当创建进程指定node的权限为AuthPolicy.OP_ALL时,其他使用进程可以删除该node,但是不能删除其domain,这是为什么呢?

 

因为domain下通常还有其他node,它们的权限并不都是AuthPolicy.OP_ALL,比如还有一个n1的node权限为AuthPolicy.OP_READ,按照正常操作,该使用进程无法删除n1,假设它可以删除domain,那么它最后间接删除了n1,于是发生了悖论,因此,为了避免风险,所有的使用进程只能根据权限删除node,但是无法删除domain。
从上表可以发现,当创建进程指定node的权限为AuthPolicy.OP_ALL时,其他使用进程可以删除该node,但是不能删除其domain,这是为什么呢?

不过你允许承担这样的删除风险,也可以在创建进程里强行指定该domain可删除,通过在domain创建后,调用:

public boolean setDeletable(String domain);

该方法只能被domain的创建进程调用,其他使用进程没有权限调用。

强行指定可删除后,其他进程可以直接删除该domain及所含node并忽略后果。 #p# 

四、相对于zookeeper的优势

Zookeeper无疑是一款成功的开源产品,并拥有广泛的信任者和应用场景,和以往一样,老外作者在apache网站上发布了一款产品,我们的工程师马上会虚心的学习和忠心的捍卫,而国产原创的产品往往会遭到百般质疑,因为我们的原创更多是抄袭和粗制滥造,我们的国产更多是框架集成而不是架构设计,所以这种情感上的倾向性不是一天能改变。

做产品对比和列举优势往往容易引起激烈争论,会被认为是在宣传和引导产品使用,实际上在都能满足功能需求的情况下,选择使用哪款产品更多的是个政治问题,而不是技术问题,领导意志及工程师本身的熟悉程度和爱好等等都是决定因素。

这里我们仅仅从技术角度阐述几点优势,Zookeeper做为一个chubby和paxos模仿品,缺乏创新型的设计改进,它仍然存在以下缺点:

1、树型配置节点的繁琐复杂,性能低下。为了保证这种结构,Zookeeper需要维持一套虚拟文件结构的开销,对于目录结构深的树节点,造成性能影响,而配置信息结构实际上往往不一定需要树结构。

2、“观察”(watch)机制的僵化设计:zookeeper没有获取最新版本信息的方法支持,它只能粗暴的在每次写入更新等方法时注册一个watch,当这些方法被调用后就回调,它不考虑信息内容是否变化,对于没有使信息内容发生改变的更新,zookeeper仍然会回调,并且zookeeper的回调比较呆板,它只能用一次,如果信息持续变化,必须又重新注册watch。而fourinone的事件处理则可以自由控制是否持续响应信息变化。

3、领导者选举机制实现的太过局限,集群只有两个节点,zookeeper无法进行领导者选举,zookeeper的领导者选举必须要奇数节点的奇怪限制。另外,ZooKeeper的领导者选举实现虽然比原始的Paxos要简化,但是它仍然存在领导者(Leader)、跟随者(Follower)、观察者(observer)、学习者 (Learner)等众多角色和跟随状态(Following)、寻找状态(Looking)、观察状态(Observing)、领导状态 (Leading)等复杂状态。相对于fourinone的领导者选举,zookeeper仍然不够直观简洁,难以用较少配置和代码演示。

4、Windows系统上几乎不支持,需要安装linux壳,并且仅建议用于学习研究。Fourinone支持windows、linux集群混合使用。

Fourinone提出一种新的分布式协同系统设计,在满足zookeeper所有功能下,并克服了以上缺点,提出了新的配置结构、变化事件机制、简化的领导者选举实现,能更好的满足分布式协调需求。 #p# 

五、演示demo

下面是一个操作节点的演示demo,请留意各自节点的权限范围,程序说明:

1、 ParkServerDemo: 启动parkserver(它的IP端口已经在配置文件的PARK部分的SERVERS指定

2、 ParkSet:往parkserver里创建了d1n1、d2n2、d3n3、d4n4共4个节点,分别对应只读、读写,所有,所有+强行删除权限

3、 ParkGet:依次对d1n1、d2n2、d3n3、d4n4进行读、写、删除、删除domain操作,观察结果输出,如果没有权限操作,parkserver会输出信息,并且操作返回的结果对象为空

启动命令和顺序:

Javac –classpath fourinone.jar; *.java

Java –classpath fourinone.jar; ParkServerDemo

Java –classpath fourinone.jar; ParkSet

Java –classpath fourinone.jar; ParkGet

如果没有fourinone.jar,可以到以下地址下载:

http://www.skycn.com/soft/68321.html

下面是demo源码:

// ParkServerDemo

import com.fourinone.BeanContext;

public class ParkServerDemo{

public static void main(String[] args){

BeanContext.startPark();

}

}

// ParkSet

import com.fourinone.BeanContext;

import com.fourinone.ParkLocal;

import com.fourinone.ObjectBean;

import com.fourinone.AuthPolicy;

public class ParkSet{

public static void main(String[] args){

//获取parkserver用户接口

ParkLocal pl = BeanContext.getPark();

//在domain d1下创建节点node n1,指定权限为只读

ObjectBean d1n1 = pl.create("d1","n1","v1",AuthPolicy.OP_READ);

if(d1n1!=null)

System.out.println("d1n1 with AuthPolicy.OP_READ create success!");

//在domain d2下创建节点node n2,指定权限为读写

ObjectBean d2n2 = pl.create("d2","n2","v2",AuthPolicy.OP_READ_WRITE);

if(d2n2!=null)

System.out.println("d2n2 with AuthPolicy.OP_READ_WRITE create success!");

//在domain d3下创建节点node n3,指定权限为所有

ObjectBean d3n3 = pl.create("d3","n3","v3",AuthPolicy.OP_ALL);

if(d3n3!=null)

System.out.println("d3n3 with AuthPolicy.OP_ALL create success!");

//在domain d4下创建节点node n4,指定权限为所有,并且创建完成强行设置为其他进程可删除

ObjectBean d4n4 = pl.create("d4","n4","v4",AuthPolicy.OP_ALL);

if(d4n4!=null)

System.out.println("d4n4 with AuthPolicy.OP_ALL create success!");

boolean r = pl.setDeletable("d4");

if(r)

System.out.println("set d4 deletable!");

}

}

// ParkGet

import com.fourinone.BeanContext;

import com.fourinone.ParkLocal;

import com.fourinone.ObjectBean;

import java.util.List;

public class ParkGet{

public static void main(String[] args){

//获取parkserver用户接口

ParkLocal pl = BeanContext.getPark();

//获取节点d1n1,节点权限为AuthPolicy.OP_READ

ObjectBean d1n1 = pl.get("d1","n1");//获取节点

System.out.println("get d1n1:"+(String)d1n1.toObject());

d1n1 = pl.update("d1","n1","v1-update");//更新节点

if(d1n1!=null)

System.out.println("update node d1n1 success!");

else

System.out.println("update node d1n1 failure!");

List d1 = pl.delete("d1");//删除domain

if(d1!=null)

System.out.println("delete domain d1 success!");

else

System.out.println("delete domain d1 failure!");

d1n1 = pl.delete("d1","n1");//删除节点

if(d1n1!=null)

System.out.println("delete node d1n1 success!");

else

System.out.println("delete node d1n1 failure!");

//获取节点d2n2,节点权限为AuthPolicy.OP_READ_WRITE

ObjectBean d2n2 = pl.get("d2","n2");

System.out.println("get d2n2:"+(String)d2n2.toObject());

d2n2 = pl.update("d2","n2","v2-update");

if(d2n2!=null)

System.out.println("update node d2n2 success!");

else

System.out.println("update node d2n2 failure!");

List d2 = pl.delete("d2");

if(d2!=null)

System.out.println("delete domain d2 success!");

else

System.out.println("delete domain d2 failure!");

d2n2 = pl.delete("d2","n2");

if(d2n2!=null)

System.out.println("delete node d2n2 success!");

else

System.out.println("delete node d2n2 failure!");

//获取节点d3n3, 节点权限为AuthPolicy.OP_ALL

ObjectBean d3n3 = pl.get("d3","n3");

System.out.println("get d3n3:"+(String)d3n3.toObject());

d3n3 = pl.update("d3","n3","v3-update");

if(d3n3!=null)

System.out.println("update node d3n3 success!");

else

System.out.println("update node d3n3 failure!");

List d3 = pl.delete("d3");

if(d3!=null)

System.out.println("delete domain d3 success!");

else

System.out.println("delete domain d3 failure!");

d3n3 = pl.delete("d3","n3");

if(d3n3!=null)

System.out.println("delete node d3n3 success!");

else

System.out.println("delete node d3n3 failure!");

//获取节点d4n4,节点权限为AuthPolicy.OP_ALL

ObjectBean d4n4 = pl.get("d4","n4");

System.out.println("get d4n4:"+(String)d4n4.toObject());

d4n4 = pl.update("d4","n4","v4-update");

if(d4n4!=null)

System.out.println("update node d4n4 success!");

else

System.out.println("update node d4n4 failure!");

//由于创建进程已经强行指定该domain可删除setDeletable(d4),因此这里可以删除掉

List d4 = pl.delete("d4");

if(d4!=null)

System.out.println("delete domain d4 success!");

else

System.out.println("delete domain d4 failure!");

d4n4 = pl.delete("d4","n4");//这里删除节点会失败,因为上面已经删除了该domian下所有节点

if(d4n4!=null)

System.out.println("delete node d4n4 success!");

else

System.out.println("delete node d4n4 failure!");

}

}

 

责任编辑:王程程 来源: 51CTO
相关推荐

2021-06-01 07:57:42

Zookeeper分布式系统

2021-07-29 07:48:36

Zookeeper 核心设计

2022-04-07 17:13:09

缓存算法服务端

2012-06-01 15:12:00

淘宝分布式计算Fourinone2.

2023-02-23 07:55:41

2011-12-30 15:01:36

淘宝

2021-08-26 08:03:30

大数据Zookeeper选举

2015-06-17 14:10:34

Redis分布式系统协调

2014-07-15 11:15:44

hadoop分布式部署

2019-08-05 07:58:01

分布式架构系统

2023-10-08 10:49:16

搜索系统分布式系统

2023-03-13 00:08:26

2019-10-10 09:16:34

Zookeeper架构分布式

2024-01-08 08:05:08

分开部署数据体系系统拆分

2023-05-29 14:07:00

Zuul网关系统

2017-09-01 05:35:58

分布式计算存储

2019-06-19 15:40:06

分布式锁RedisJava

2017-12-12 14:51:15

分布式缓存设计

2013-01-07 10:29:31

大数据

2018-10-29 12:51:35

分布式存储元数据
点赞
收藏

51CTO技术栈公众号