聊聊StampedLock的使用和主要实现思想

开发 前端
今天,我们比较仔细地介绍StampedLock的使用和主要实现思想,StampedLock是一种重入锁和读写锁的重要补充。

[[390130]]

前言

在多线程开发中,为了控制线程同步,使用的最多的莫过于synchronized 关键字和重入锁。在JDK8中,又引入了一款新式武器StampedLock。这是一个什么东西呢?英文单词Stamp,意思是邮戳。那在这里有用什么含义呢?傻瓜,请看下面的分解。

面对临界区资源管理的问题,大体上有2套思路:

第一就是使用悲观的策略,悲观者这样认为:在每一次访问临界区的共享变量,总是有人会和我冲突,因此,每次访问我必须先锁住整个对象,完成访问后再解锁。

而与之相反的乐天派却认为,虽然临界区的共享变量会冲突,但是冲突应该是小概率事件,大部分情况下,应该不会发生,所以,我可以先访问了再说,如果等我用完了数据还没人冲突,那么我的操作就是成功;如果我使用完成后,发现有人冲突,那么我要么再重试一次,要么切换为悲观的策略。

 

从这里不难看到,重入锁以及synchronized 是一种典型的悲观策略。聪明的你一定也猜到了,StampedLock就是提供了一种乐观锁的工具,因此,它是对重入锁的一个重要的补充。

StampedLock的基本使用

在StampedLock的文档中就提供了一个非常好的例子,让我们可以很快的理解StampedLock的使用。下面让我看一下这个例子,有关它的说明,都写在注释中了。

 

这里再说明一下validate()方法的含义,函数签名长这样:

  1. public boolean validate(long stamp) 

它的接受参数是上次锁操作返回的邮戳,如果在调用validate()之前,这个锁没有写锁申请过,那就返回true,这也表示锁保护的共享数据并没有被修改,因此之前的读取操作是肯定能保证数据完整性和一致性的。

反之,如果锁在validate()之前有写锁申请成功过,那就表示,之前的数据读取和写操作冲突了,程序需要进行重试,或者升级为悲观锁。

和重入锁的比较

从上面的例子其实不难看到,就编程复杂度来说,StampedLock其实是要比重入锁复杂的多,代码也没有以前那么简洁了。

那么,我们为什么还要使用它呢?

最本质的原因,就是为了提升性能!一般来说,这种乐观锁的性能要比普通的重入锁快几倍,而且随着线程数量的不断增加,性能的差距会越来越大。

简而言之,在大量并发的场景中StampedLock的性能是碾压重入锁和读写锁的。

但毕竟,世界上没有十全十美的东西,StampedLock也并非全能,它的缺点如下:

编码比较麻烦,如果使用乐观读,那么冲突的场景要应用自己处理

它是不可重入的,如果一不小心在同一个线程中调用了两次,那么你的世界就清净了。。。。。

它不支持wait/notify机制

如果以上3点对你来说都不是问题,那么我相信StampedLock应该成为你的首选。

内部数据结构

为了帮助大家更好的理解StampedLock,这里再简单给大家介绍一下它的内部实现和数据结构。

在StampedLock中,有一个队列,里面存放着等待在锁上的线程。该队列是一个链表,链表中的元素是一个叫做WNode的对象:


当队列中有若干个线程等待时,整个队列可能看起来像这样的:

除了这个等待队列,StampedLock中另外一个特别重要的字段就是long state, 这是一个64位的整数,StampedLock对它的使用是非常巧妙的。

state 的初始值是:

  1. private static final int LG_READERS = 7; 
  2. private static final long WBIT  = 1L << LG_READERS; 
  3. private static final long ORIGIN = WBIT << 1; 

也就是 ...0001 0000 0000 (前面的0太多了,不写了,凑足64个吧~),为什么这里不用0做初始值呢?因为0有特殊的含义,为了避免冲突,所以选择了一个非零的数字。

如果有写锁占用,那么就让第7位设置为1 ...0001 1000 0000,也就是加上WBIT。

每次释放写锁,就加1,但不是state直接加,而是去掉最后一个字节,只使用前面的7个字节做统计。因此,释放写锁后,state就变成了:...0010 0000 0000, 再加一次锁,又变成:...0010 1000 0000,以此类推。

这里为什么要记录写锁释放的次数呢?

这是因为整个state 的状态判断都是基于CAS操作的。而普通的CAS操作可能会遇到ABA的问题,如果不记录次数,那么当写锁释放掉,申请到,再释放掉时,我们将无法判断数据是否被写过。而这里记录了释放的次数,因此出现"释放->申请->释放"的时候,CAS操作就可以检查到数据的变化,从而判断写操作已经有发生,作为一个乐观锁来说,就可以准确判断冲突已经产生,剩下的就是交给应用来解决冲突即可。因此,这里记录释放锁的次数,是为了精确地监控线程冲突。

而state剩下的那一个字节的其中7位,用来记录读锁的线程数量,由于只有7位,因此只能记录可怜的126个,看下面代码中的RFULL,就是读线程满载的数量。超过了怎么办呢,多余的部分就记录在readerOverflow字段中。

  1. private static final long WBIT  = 1L << LG_READERS; 
  2. private static final long RBITS = WBIT - 1L; 
  3. private static final long RFULL = RBITS - 1L; 
  4. private transient int readerOverflow; 

总结一下,state变量的结构如下:

 

写锁的申请和释放

在了解了StampedLock的内部数据结构之后,让我们再来看一下有关写锁的申请和释放吧!首先是写锁的申请:

  1. public long writeLock() { 
  2.     long s, next;   
  3.     return ((((s = state) & ABITS) == 0L &&  //有没有读写锁被占用,如果没有,就设置上写锁标记 
  4.              U.compareAndSwapLong(this, STATE, s, next = s + WBIT)) ? 
  5.             //如果写锁占用成功范围next,如果失败就进入acquireWrite()进行锁的占用。 
  6.             next : acquireWrite(false, 0L)); 

如果CAS设置state失败,表示写锁申请失败,这时,会调用acquireWrite()进行申请或者等待。acquireWrite()大体做了下面几件事情:

1.入队

  • 如果头结点等于尾结点wtail == whead, 表示快轮到我了,所以进行自旋等待,抢到就结束了
  • 如果wtail==null ,说明队列都没初始化,就初始化一下队列
  • 如果队列中有其他等待结点,那么只能老老实实入队等待了

2.阻塞并等待

  • 如果头结点等于前置结点(h = whead) == p), 那说明也快轮到我了,不断进行自旋等待争抢
  • 否则唤醒头结点中的读线程
  • 如果抢占不到锁,那么就park()当前线程

简单地说,acquireWrite()函数就是用来争抢锁的,它的返回值就是代表当前锁状态的邮戳,同时,为了提高锁的性能,acquireWrite()使用大量的自旋重试,因此,它的代码看起来有点晦涩难懂。

写锁的释放如下所示,unlockWrite()的传入参数是申请锁时得到的邮戳:

  1. public void unlockWrite(long stamp) { 
  2.     WNode h; 
  3.     //检查锁的状态是否正常 
  4.     if (state != stamp || (stamp & WBIT) == 0L) 
  5.         throw new IllegalMonitorStateException(); 
  6.     // 设置state中标志位为0,同时也起到了增加释放锁次数的作用 
  7.     state = (stamp += WBIT) == 0L ? ORIGIN : stamp; 
  8.     // 头结点不为空,尝试唤醒后续的线程 
  9.     if ((h = whead) != null && h.status != 0) 
  10.         //唤醒(unpark)后续的一个线程 
  11.         release(h); 

读锁的申请和释放

获取读锁的代码如下:

  1. public long readLock() { 
  2.     long s = state, next;   
  3.     //如果队列中没有写锁,并且读线程个数没有超过126,直接获得锁,并且读线程数量加1 
  4.     return ((whead == wtail && (s & ABITS) < RFULL && 
  5.              U.compareAndSwapLong(this, STATE, s, next = s + RUNIT)) ? 
  6.             //如果争抢失败,进入acquireRead()争抢或者等待 
  7.             next : acquireRead(false, 0L)); 

acquireRead()的实现相当复杂,大体上分为这么几步:


总之,就是自旋,自旋再自旋,通过不断的自旋来尽可能避免线程被真的挂起,只有当自旋充分失败后,才会真正让线程去等待。

下面是释放读锁的过程:

 

StampedLock悲观读占满CPU的问题

StampedLock固然是个好东西,但是由于它特别复杂,难免也会出现一些小问题。下面这个例子,就演示了StampedLock悲观锁疯狂占用CPU的问题:

  1. public class StampedLockTest { 
  2.     public static void main(String[] args) throws InterruptedException { 
  3.         final StampedLock lock = new StampedLock(); 
  4.         Thread t1 = new Thread(() -> { 
  5.             // 获取写锁 
  6.             lock.writeLock(); 
  7.             // 模拟程序阻塞等待其他资源 
  8.             LockSupport.park(); 
  9.         }); 
  10.         t1.start(); 
  11.         // 保证t1获取写锁 
  12.         Thread.sleep(100); 
  13.         Thread t2 = new Thread(() -> { 
  14.             // 阻塞在悲观读锁 
  15.             lock.readLock(); 
  16.         }); 
  17.         t2.start(); 
  18.         // 保证t2阻塞在读锁 
  19.         Thread.sleep(100); 
  20.         // 中断线程t2,会导致线程t2所在CPU飙升 
  21.         t2.interrupt(); 
  22.         t2.join(); 
  23.     } 

上述代码中,在中断t2后,t2的CPU占用率就会沾满100%。而这时候,t2正阻塞在readLock()函数上,换言之,在受到中断后,StampedLock的读锁有可能会占满CPU。这是什么原因呢?机制的小傻瓜一定想到了,这是因为StampedLock内太多的自旋引起的!没错,你的猜测是正确的。

具体原因如下:

如果没有中断,那么阻塞在readLock()上的线程在经过几次自旋后,会进入park()等待,一旦进入park()等待,就不会占用CPU了。但是park()这个函数有一个特点,就是一旦线程被中断,park()就会立即返回,返回还不算,它也不给你抛点异常啥的,那这就尴尬了。本来呢,你是想在锁准备好的时候,unpark()的线程的,但是现在锁没好,你直接中断了,park()也返回了,但是,毕竟锁没好,所以就又去自旋了。

转着转着,又转到了park()函数,但悲催的是,线程的中断标记一直打开着,park()就阻塞不住了,于是乎,下一个自旋又开始了,没完没了的自旋停不下来了,所以CPU就爆满了。

要解决这个问题,本质上需要在StampedLock内部,在park()返回时,需要判断中断标记为,并作出正确的处理,比如,退出,抛异常,或者把中断位给清理一下,都可以解决问题。

但很不幸,至少在JDK8里,还没有这样的处理。因此就出现了上面的,中断readLock()后,CPU爆满的问题。请大家一定要注意。

写在最后

今天,我们比较仔细地介绍了StampedLock的使用和主要实现思想,StampedLock是一种重入锁和读写锁的重要补充。

它提供了一种乐观锁的策略,是一种与众不同的锁实现。当然了,就编程难度而言,StampedLock会比重入锁和读写锁稍微繁琐一点,但带来的却是性能的成倍提升。

这里给大家提一些小意见,如果我们的应用线程数量可控,并且不多,竞争不太激烈,那么就可以直接使用简单的synchronized,重入锁,读写锁就好了;如果应用线程数量多,竞争激烈,并且对性能敏感,那么还是需要我们劳神费力,用一下比较复杂的StampedLock,来提高一下程序的吞吐量。

使用StampedLock还需要特别注意两点:第一StampedLock不是可重入的,千万不要单线程自己和自己搞死锁了,第二,StampedLock没有等待/通知机制,如果一定需要这个功能的话,也只能绕行啦!

我是敖丙,你知道的越多,不知道的越多,我们下期见。

 

责任编辑:姜华 来源: 三太子敖丙
相关推荐

2010-01-22 13:28:13

VB.NET对象克隆

2017-11-08 12:51:12

2024-10-10 17:17:57

2024-04-15 10:32:14

2022-12-27 08:19:25

2022-03-05 23:29:18

LibuvwatchdogNode.js

2023-01-02 10:08:42

StampedLocAQS框架

2020-07-03 08:45:26

神经网络结构

2022-09-30 00:03:03

JS断点线程

2022-10-08 00:07:00

JSV8调用栈

2020-11-23 08:53:34

堆Heap

2021-04-16 07:19:04

Hive数据类型Hql

2011-07-08 17:37:10

软件思想

2022-02-18 08:26:12

TopK数组面试题

2021-07-14 14:05:24

Fragment项目结构

2024-05-31 09:31:00

2024-03-06 11:38:12

Appwrite方式Supabase

2017-03-06 16:51:52

Java泛型实现

2022-08-05 08:27:05

分布式系统线程并发

2023-01-26 00:59:39

B-Treegolang度量衡
点赞
收藏

51CTO技术栈公众号