什么是分布式
提到分布式,一定就会涉及到集中式,相比于集中式,分布式说明存在很多个节点,各个节点彼此协同工作。
从分布式的概念可以看出,分布式强调彼此的协同,每个节点负责部分工作,比如我们的一个商城系统,可以分成订单系统,用户系统,短信系统,支付系统等等。从外部来看他们是一个整体,提供一个商城的完整功能。
为什么会出现分布式
集中式的部署很方便,而且不会有节点网络问题,不会出现不统一的问题,不会出现可用性等问题,虽然集中式有各种各样的优点,但是面对高并发的时候,面对更大数据请求的时候,显然单个节点无法满足要求,这个时候就需要将请求分配到不同的机器节点上,这样才能让请求得到正确响应。
代码如何编写
不同于我们写的集中式编码方式,在涉及到分布式的时候,我们需要考虑session的共享问题,对于session的共享问题,我们一般通过redis来进行数据的共享。
对于同一个用户的请求,如果被分配到不同的机器上可能会导致数据的不一致问题,这个时候我们需要考虑让同一个用户的请求被同一个节点机器处理,这就需要考虑对用户的ip做hash处理,让同一个ip被相同的机器处理。
对于文件的存储我们也需要进行处理,我们不能将文件保存到各个机器上,我们应该做的是找一个单独的文件服务器进行文件的存储管理,不过一般我们都是采用云对象存储,这样所有的静态资源请求都会由单独的云存储进行管理,可以进行cdn缓存,大大提高了服务器的负载。
分布式锁
对于在一个主机上的资源并发访问,我们可以通过加锁来解决,但是对于分布式机器上的资源,如果有并发请求的话,我们就需要使用分布式锁来进行处理。
对于分布式锁有很多种解决方案,主要是数据库mysql,分布式调度zooker,内存数据库redis等。
很多情况下,我们都是采用redlock进行分布式锁的处理。
分布式算法
提到分布式,离不开的问题就是一致性问题,为了保证数据的一致性,我们就需要通过一定的算法来实现,而常用的分布式一致性算法Paxos、Raft。
总结
分布式和我们平时开发集中式的业务有着本质上的区别,原本不会产生问题的地方,因为网络或者其它原因都会产生问题,我们能够做的就是充分考虑到可能出现的问题,学习别人已经总结出来的算法和架构,这样在遇到问题的时候才能有的放矢。