熔断规则
在上一篇文章中我们讲解了流控规则的使用和介绍Sentinel流控规则,今天我们给大家讲解sentinel更多样化的讲解以及流量控制。
官方文档:https://sentinelguard.io/zh-cn/docs/circuit-breaking.html
在面对调用链路中不稳定的资源如何保证高可用?在微服务中一个服务通常会调用其他的模块,可能是服务内的某个应用也有可能是另外的一个远程服务,数据库或者其他API调用。比如我们在支付的时候会调用(某付宝、某信、某联)提供的API,在查询订单我们会调用数据库连接,这些依赖的服务有可能会存在系统不稳定的情况,如果依赖的服务出现了不稳定的情况,请求响应时间过长,线程资源产生堆积,可能最终会耗尽服务的资源,导致服务变的不可用,这个时候熔断降级是保证服务高可用的重要措施之一。
如今的微服务都是分布式,有很多服务组成,不同服务之间互相调用,有着比较复杂的调用链路,在上面我们只是模拟绘画了支付操作,在实际的链路调用过程中会有着放大效果,如果某一环不稳定,可能会形成蝴蝶效应最终导致整个链路响应时间过长,甚至不可用,所以如果当我们的服务出现 不稳定且没有强依赖服务调用的时,可以进行熔断降级,暂时限制不稳定的调用,避免影响整体服务。
熔断策略:
sentinel提供了三种熔断策略:
- 慢调用比例: 选择以慢调用比例作为阈值,需要设置允许的慢调用RT(最大响应时间),如果请求响应时间大于该值则认为慢调用,当统计时长内请求数大于最小请求数,且慢调用比例大于阈值,在熔断时长内的请求会被自动熔断,超过熔断时长进入半恢复状态(HALF_OPEN),如果下一个请求响应时间小于慢调用比例RT结束熔断,否则再次熔断。
- 异常比例: 当统计时长内请求数大于最小请求数,且异常比例大于设定的阈值,在熔断时间内请求自动熔断,超过熔断时长进入半恢复状态(HALF_OPEN),如果下一个请求成功,结束熔断,否则再次熔断,异常比例阈值范围(0.0-1.0)代表百分比。
- 异常数: 当统计时长内异常数大于阈值,自动进行熔断,超过熔断时长进入半恢复状态(HALF_OPEN),如果下一个请求成功,结束熔断,否则再次熔断。
熔断状态:
熔断状态 | 说明 |
OPEN | 熔断开启,拒绝所有请求 |
HALF_OPEN | 熔断半开启(恢复状态),如果接下来请求成功结束熔断,否则继续熔断 |
CLOSE | 熔断关闭,请求通过 |
热点参数规则的核心属性:
属性(Field) | 说明 | 默认值 |
resource | 资源名(规则的作用对象 ) 必填 | |
grade | 熔断策略(支持慢调用比例/异常比例/异常数策略) 必填 | 慢调用比例 |
count | 慢调用比例模式下为慢调用临界 RT(超出该值计为慢调用);异常比例/异常数模式下为对应的阈值 | |
timeWindow | 熔断时长,单位为 s | |
minRequestAmount | 熔断触发的最小请求数,请求数小于该值时即使异常比率超出阈值也不会熔断(1.7.0 引入) | 5 |
statIntervalMs | 统计时长(单位为 ms),如 60*1000 代表分钟级(1.8.0 引入) | 1000 ms |
slowRatioThreshold | 慢调用比例阈值,仅慢调用比例模式有效(1.8.0 引入) |
熔断策略 - 慢调用比例
选择以慢调用比例作为阈值,需要设置允许的慢调用RT(最大响应时间),如果请求响应时间大于该值则认为慢调用,当统计时长内请求数大于最小请求数,且慢调用比例大于阈值,在熔断时长内的请求会被自动熔断,超过熔断时长进入半恢复状态(HALF_OPEN),如果下一个请求响应时间 小于慢调用比例RT结束熔断,否则再次熔断。
如果我们一秒钟请求的数量大于5且RT(最大响应时间)大于我们设置的比例阈值的时候,触发熔断策略,比如我们有8个请求在一秒中进来,有5个慢调用,比例阈值设置为0.1,这个时候我们满足(QPS > 5 且 RT > 比例阈值),进入下一步熔断策略,触发熔断器。
熔断器的内部使用的是断路器,这个好比我们做核酸,本来一栋一栋下去做,如果服务或者检测机器蹦了,通知你暂时不要下来,当机器恢复了,再通知你下来做,这个就类似我们的断路器。
案例演示:
@GetMapping("/fuse")
public String fuse(){
try {
TimeUnit.SECONDS.sleep(3);
} catch (InterruptedException e) {
e.printStackTrace();
}
return "hello fuse";
}
设置我们的熔断策略,如果QPS>5请求RT>250且大于比例阈值触发熔断。
通过JMeter测试,1秒钟发起10个线程请求,此时就会触发熔断效果,停止测试以后,10秒钟恢复正常。
当我们启动线程之后,再去访问fuse接口,可以看到被熔断了,那么当我们停止线程之后,十秒之后去访问,就可以正常访问。
熔断策略 - 异常比例
当统计时长内请求数大于最小请求数,且异常比例大于设定的阈值,在熔断时间内请求自动熔断,超过熔断时长进入半恢复状态(HALF_OPEN),如果下一个请求成功,结束熔断,否则再次熔断,异常比例阈值范围(0.0-1.0)代表百分比。异常降级仅仅只针对业务异常,对于sentinel本身的异常不生效。
测试:
@GetMapping("/exptoin")
public String exptoin(Integer id){
if(id != null && id > 1){
throw new RuntimeException("异常比例测试");
}
return "exptoin test";
}
接下来我们用JMeter进行测试,设置Http请求地址:http://localhost:8006/exptoin?id=5当启动JMeter的时候,会触发熔断,这个时候我们1秒钟发送10个请求超过了最小请求数,同事超过了阈值,满足两个条件,当熔断时间结束 以后恢复正常。
熔断策略 - 异常数
当统计时长内异常数大于阈值,自动进行熔断,超过熔断时长进入半恢复状态(HALF_OPEN),如果下一个请求成功,结束熔断,否则再次熔断。
测试代码:
@GetMapping("/exptoin/num")
public String exptoinNum(Integer id){
if(id != null && id > 1){
throw new RuntimeException("异常数测试");
}
return "exptoinNum test";
}
设置异常数策略,当1秒钟内请求超过5并且异常数大约5个的时候触发熔断。
热点规则
官网文档:https://sentinelguard.io/zh-cn/docs/parameter-flow-control.html
什么是热点规则?热点我们很好理解,就是很火的东西在程序中可以理解成频繁访问的数据,那么有时候我们系统通缉你某个热点数据中访问频次最高的前几个数据对其进行限制访问。
例如在秒杀系统中,某一款商品或者某几款商品,要定点秒杀,我们可以以商品ID为参数,在一定时间内对其进行限流。
又或者如果某一个用户频繁的去访问我们系统,我们也可以针对于用户ID或者IP进行限制。
热点规则会统计入参参数中的热点数据,根据配置的限流阈值和模式,对启动的热点数据进行限流也就是流量控制。
在上图中我们携带了是三个参数(axb\abc\xs)等,我们在sentinel中设置热点限流,我们设置的QPS为5,注意:该模式只支持QPS限制,如果我们的axb参数,命中了我们的规则,那么该请求携带的参数就会被限流。
在使用热点规则的时候,我们需要配合对应的@SentinelResource注解进行使用,才能够达到更加细粒度的流控规则。
@SentinelResource
- value:代表资源名称,必填,通过name找到对应的规则。
- blockHandler:blockHandler 对应处理 BlockException 的方法名称,可选项,访问范围为public,返回类型需要和原方法匹配,并且在最后一需要添加BlockException类型的参数。
测试代码:
@GetMapping("/hotTest")
@SentinelResource(value = "hotTest")
public String testHotKey(@RequestParam(value = "v1",required = false) String v1,
@RequestParam(value = "v2",required = false)String v2){
return "热点规则 - 热点:";
}
在这里我们要注意,我们需要配置的是不带斜杠的资源名称,这个才是我们需要配置的项目。
这个时候我们传入参数 http://localhost:8006/hotTest?v1,不停的刷新浏览器,这个时候会超过阈值,那么下面就会出现限流。
但是,这个报错信息不是很友好,一般人根本不知道啥意思,我们可以使用@SentinelResource注解提供的另外一个参数blockHandler,这个参数是可以指定当出现异常时的处理方法,操作如下:
@GetMapping("/hotTest")
@SentinelResource(value = "hotTest",blockHandler = "handler_hot")
public String testHotKey(@RequestParam(value = "v1",required = false) String v1,
@RequestParam(value = "v2",required = false)String v2){
if("5".equals(v1)){
throw new RuntimeException("报告有bug!!!");
}
return "热点规则 - 热点:";
}
//处理异常方法,方法签名要和对应的接口方法保持一致
public String handler_hot(String v1, String v2, BlockException exception){
return "请求过于频繁,请稍后再试.....";
}
重新添加热点规则后,再去频繁的去访问,效果如下:
例外项数目:
热点规则除了上述的基础使用外,还有例外项的操作,例外项参数可以达到更加细粒度的控制,比如我们在当前的案例中,目前v1参数在访问时超过阈值则会被限流,当时如果我们想通过参数v1等于具体的值的时候,来出发不同的流控效果时,改怎么操作呢?
比如我想要让v1等于2的时候,阈值达到50,其他的规则走上面的规则。
如果当前v1的值为2的时候,会走例外项里面的设置,也就是50的阈值,如果不是2会走普通的阈值规则,通过下图我们可以看到如果为2的值,无论我们点击多少次,都不会提示我们请求过于频繁。
系统规则
sentinel系统自适应限流是从整体维度对应用入口流量进行控制,结合应用的load、CPU使用率、总体平均RT、入口QPS和并发线程数等几个维度的监控指标,通过自适应的流控策略,来让系统入口流量和系统的负载达到一个平衡,让系统尽可能的在面对高并发访问的同时保证系统整体的稳定。
系统保护是应用整体,所以不具备更细粒度的操作,只针对于入口流量有效。
系统规则支持的模式:
- LOAD自适应:针对于linxu/unix 机器有效,系统load(一分钟平均负载)作为启发指标,进行自适应系统保护。
- RT:单台机器上所有的入口流量平均RT达到阈值时,触发系统保护,单位为毫秒。
- 线程数:单台机器上所有入口流量的并发线程数达到阈值触发系统保护。
- 入口QPS: 单台机器上所有入口流量的QPS达到阈值触发系统保护。
- CPU 使用率:当系统CPU使用率超过阈值时触发系统保护(取值范围:0.0 - 1.0)。
演示:
通过入口QPS来进行测试,直接设置规则;
最后测试效果不管现在我们访问那个接口只要超过阈值就会被限流。
总结
到这里我们限流策略就讲完了,其实并不复杂,我们需要了解其中每个规则如何使用,效果是怎样的。