聊聊Ntp导致的时钟回拨

运维 服务器运维
时钟回拨的情况也会影响到采用雪花算法这种对时间戳要求单调的算法。很明显的,时间戳回调后,极易形成重复的序列号。

[[401812]]

时钟回拨

我们的服务器时间校准一般是通过ntp进程去校准的。但由于校准这个动作,会导致时钟跳跃变化的现象。而这种情况里面,往往回拨最能引起我们的困扰,回拨如下所示:

会引起什么问题

准点调度任务的误判

假设有一个任务每天0点时候获取昨天所有的数据进行对账,正常情况和时钟回拨的情况如下图所示:

针对这种情况,笔者让业务调整了调度触发时间,不要精确在准点,以避免此问题。

唯一序列号(雪花算法)

时钟回拨的情况也会影响到采用雪花算法这种对时间戳要求单调的算法。很明显的,时间戳回调后,极易形成重复的序列号。

对于这种情况我们采用预留序列号段,在检测到这种情况后,将预留序列号分配出去,进而解决这一问题。

ntpd的时钟回拨(跳变)条件

事实上,ntpd本身还有另一种方案,即通过调整滴答频率来让我们的本地时钟慢慢的和精确时间match。但是,如果本机时间和精确时间(从ntpd服务器获取的时间)相差过大(> stepout threshold 128ms),则ntpd会直接采用跳跃变化的方式修正时间。代码如下所示:

  1. ntp_loopfilter.c 
  2.  
  3. double  clock_max = CLOCK_MAX; // .128也就是128ms 
  4.  
  5. int local_lock(...) { 
  6.     // 差距>128ms之后,选择跳变 
  7.     if (fabs(fp_offset) > clock_max && clock_max > 0) { 
  8.         ...... 
  9.         // 修正simclock.local_time 
  10.         step_systime(fp_offset); 
  11.         ...... 
  12.     } 

而在我们的线上,在/var/log/message中经常能见到时钟跳变的输出。

-x选项

我们采用-x选项,可以将stepout threshold(128ms)提升到600s。这样,不是太极端的情况,应该都不会触发到时钟回拨。但这会导致长时间时间戳不准确的问题(毕竟,调整滴答频率来慢慢match比较慢)。

stepback stepback

在高版本的ntpd中,还可以有stepback选项,如果设置为0的话,则不会回拨。

本文转载自微信公众号「解Bug之路」,作者解Bug之路。转载本文请联系解Bug之路公众号。

 

责任编辑:武晓燕 来源: 解Bug之路
相关推荐

2024-11-19 15:55:49

2015-08-17 18:14:37

容联

2019-06-10 15:50:54

LinuxNTP命令

2024-08-09 13:39:27

2022-07-17 06:50:10

微软Windows 11

2019-05-07 10:00:03

ChronyNTPLinux

2010-07-29 11:02:25

VPN连接

2022-01-27 08:53:31

LinuxNTP同步

2020-05-06 22:07:53

UbuntuLinux操作系统

2023-04-26 00:06:22

服务器死循环报错

2020-11-26 12:40:26

NTSNTP系统运维

2024-05-27 08:25:05

2015-05-25 09:13:31

NTP网络时间协议NTP服务器

2011-08-11 18:38:05

Oracle回滚段

2021-01-14 08:58:12

Synchronize锁操作

2024-08-15 09:41:18

2010-07-12 10:05:40

ibmdwLinux

2022-06-30 08:58:09

时钟轮RPC框架

2010-03-09 17:19:01

Linux时钟

2015-07-31 11:29:25

锤子时钟
点赞
收藏

51CTO技术栈公众号