什么是负载均衡呢?笔者在接触这个技术词语的时候,从字面上很好理解,就是让负载平衡,均匀。但是,随着学习了解,却越发对这个概念模糊起来,到底有什么应用,到底如何实现呢?对于像笔者这种“万年小白",想要搞清楚什么是负载均衡,还真不是一句两句能说清楚的。那么,在学习的过程中,笔者发现一篇文章,很基础,文章也很直白。那么,在此,推荐给大家,希望能让像我这样的初学者掌握其中的基础概念。
负载均衡的作用:把不同的客户端的请求通过负载均衡策略分配到不同的服务器上去。
负载均衡的基本工作方式:通过更改请求的目的地址对请求进行转发,在服务器返回数据包的时候更改返回数据包的源地址保证客户端请求的目的和返回包是同一个地址。
现在大家基本上已经知道了什么是负载均衡,以及对它的作用和工作方式都有了一个了解。下面我们再来细化一下它的内容。
负载均衡设计的三个要素:分发策略、会话保持和服务器健康检查。
分发策略:即负载均衡设备根据什么样的策略把请求分发到不同的后台服务器上。最简单的算法就是轮询,把用户的请求依次分配到服务器上。
会话保持:在大部分的应用中都会涉及到服务器Session控制。而且这些Session通常不会在服务器之间进行复制的。也就是说一个用户在登录的时候,如果分配到了某一台服务器上,则最基本的要求就是这个用户后续的请求都分配到这台服务器上。如果分配到其他的服务器上则可能不认识这个用户的请求,而造成请求失败。最简单的会话保持策略是源地址会话保持,也就是负载均衡设备认为同一个源地址过来的所有请求都是发自于同一个客户端。在源地址会话保持的情况下,一个客户端的第一个请求会按照负载均衡策略进行分配,一旦分配了一台服务器之后,后续的请求都会发到这台服务器。当然,对于一些应用如新闻、图片等静态的内容就不需要会话保持了。
健康检查:负载均衡设备必须检测后台服务器是否在正常工作,如果发现某一台服务器出现了故障,则需要把这台服务器从负载均衡组里面摘掉。当故障服务器恢复服务的时候,再把服务器重新加入到负载均衡组里面进行处理。
四层负载均衡:就是以TCP的一个连接为最小单位,也就是以一个Socket连接的最小单位来进行转发,在一个Socket里面跑了多少个交易和负载均衡无关。
七层负载均衡:负载均衡设备可以按照协议识别每一笔交易,并以每个交易为最小单位进行转发。比如在一个HTTP 1.1的连接中可以包含多个Request/Response,四层负载均衡一旦在确定第一个连接的分配后,就不能对后续的request /response进行后续处理了。而七层负载均衡处理能把每一个http request/response分别进行处理。
到此,相信大家对什么是负载均衡有了更深一步的了解了,但是,一个技术的应用不会只局限在一两个地方,现在就来为大家详细说一下负载均衡的方式。
负载均衡实际上有多种方式:
1、DNS负载均衡,通过DNS协议实现,对于同一个域名,DNS可以同时提供多个IP地址对应,浏览器会选择第一个地址发出请求,而多个DNS地址在 Local DNS返回给客户端的时候会轮询返回,所以不同的用户得到的第一个地址是不一样的。因此,对一个域名提供多个地址可以实现负载均衡的效果。另外一种DNS 负载均衡的方式是DNS服务器判断客户端local DNS的源地址,根据不同的源地址返回不同的IP地址和域名对应。比如来源是网通,就返回网通的服务器地址,来源是电信,就返回电信的服务器地址。这样也能实现负载均衡的效果。
2、NAT负载均衡,在前面一贴已经讲过了,就不多说了。
3、重定向负载均衡,一些协议比如HTTP是可以支持重定向的,负载均衡设备通过算法决定用户的请求应该去某台服务器的时候,就返回一个302重定向指令使用户重新发送一个请求到目的服务器。这样实现负载均衡。
好了,对于什么是负载均衡,我们就先介绍到这里了,由于笔者也是初学,可能知识只是基础概括,欢迎广大的读者,爱好者指点迷津。