服务失败后如何重试?你学会了吗?

开发 前端
线性回退是指在重试尝试之间等待一个逐渐增加的固定时间间隔。例如,如果初始重试间隔设置为 1 秒,则后续重试间隔可能为 2 秒、3 秒、4 秒,依此类推,每次重试后都会增加固定时间。

在分布式系统和网络应用程序中,重试策略对于有效处理瞬时错误网络不稳定性至关重要。

重试策略能让系统在发生故障时多次尝试操作,从而提高最终成功的可能性。

下图显示了 4 种常见的重试策略。

图片图片

1.线性回退

线性回退是指在重试尝试之间等待一个逐渐增加的固定时间间隔。例如,如果初始重试间隔设置为 1 秒,则后续重试间隔可能为 2 秒、3 秒、4 秒,依此类推,每次重试后都会增加固定时间。

优点

易于实施和理解。提供可预测的重试模式。

缺点

在高负载或高并发环境下可能并不理想,因为它可能导致资源争用或 “重试风暴”,因为重试间隔是可预测的,并且仅呈线性增长。

2.线性抖动回退

线性抖动回退修改了线性回退策略,在重试间隔中引入了随机性。该策略仍线性增加延迟,但在每个间隔中添加了随机 “抖动”。例如,如果基本延迟为 3 秒,抖动可以是-1 到 1 秒之间的随机值,从而导致实际延迟为 2 秒、3 秒或 4 秒。

优点

随机性有助于在一段时间内分散重试尝试,减少跨实例同步重试的机会,这在分布式系统中尤其有用。

缺点

虽然这种策略比简单的线性后退要好,但仍可能导致同步重试的潜在问题,因为基本间隔仅线性增加。

3.指数回退

指数后退是指以指数方式增加重试之间的延迟。间隔时间可能从 1 秒开始,然后增加到 2 秒、4 秒、8 秒,依此类推,通常会达到最大延迟。这种方法在间隔重试方面比线性延迟更积极。

优点

大大减轻了系统负荷,降低了重试中发生碰撞或重叠的可能性,因此适用于高负荷环境。

缺点

在快速重试可能解决问题的情况下,这种方法可能会不必要地延迟问题的解决。

4.指数抖动回退

指数抖动回退结合了指数回退和随机性。每次重试后,回退间隔以指数形式增加,然后应用随机抖动。抖动可以是加法(在指数延迟上添加一个随机量)或乘法(将指数延迟乘以一个随机因子)。这种随机性有助于进一步防止普通指数退避中出现的同步问题。

优点

具有指数延迟的所有优点,由于引入了抖动,还能进一步减少重试碰撞。

缺点

随机性有时会导致超过必要的延迟时间,尤其是在抖动显著的情况下。

选择重试策略

重试策略的选择应基于以下因素:

  • 系统负载和性能要求:指数(带或不带抖动)等更激进的重试策略可能更适合负载较重的系统。
  • 错误类型:对于快速重试可能会成功的瞬时错误,采用不那么激进的策略可能就足够了。
  • 网络条件和服务依赖性:在多个服务相互依赖的分布式系统中,指数抖动回退等更复杂的策略有助于平滑需求峰值,减少下游服务的负载。

每种策略都可以通过最大重试次数、最大回退限制和抖动程度等参数进行调整,以根据应用的具体要求和运行条件定制回退行为。

责任编辑:武晓燕 来源: ByteByteGo
相关推荐

2022-11-30 09:54:57

网络令牌身份验证

2023-08-01 12:51:18

WebGPT机器学习模型

2024-01-02 12:05:26

Java并发编程

2023-01-10 08:43:15

定义DDD架构

2023-07-26 13:11:21

ChatGPT平台工具

2024-01-19 08:25:38

死锁Java通信

2024-02-04 00:00:00

Effect数据组件

2023-04-26 00:41:36

A/B测试邮件数量

2021-11-26 11:30:07

身高重建队列

2023-09-12 07:26:46

2024-08-09 08:17:07

SSH服务器架构

2024-08-21 08:27:30

扩展数据库服务器

2024-10-08 08:11:39

2023-05-05 06:54:07

MySQL数据查询

2023-10-06 14:49:21

SentinelHystrixtimeout

2023-08-26 21:34:28

Spring源码自定义

2022-12-06 07:53:33

MySQL索引B+树

2022-06-16 07:50:35

数据结构链表

2023-06-26 13:08:52

GraphQL服务数据

2023-03-26 22:31:29

点赞
收藏

51CTO技术栈公众号