在生产环境中,使用Redisson作为分布式锁解决方案时,可能会遇到各种复杂的问题。本文将详细分析一次线上问题:一个线程试图释放另一个线程持有的锁,即“你怎么能释放别人的锁”。
问题背景
生产环境突然告警,告警信息显示:attempt to unlock lock, not locked by current thread by node id: b9df1975-5595-42eb-beae-bdc5d67bce49 thread-id: 52。查看日志后,发现对应的堆栈信息如下:
Exception in thread "thread0" java.lang.IllegalMonitorStateException: attempt to unlock lock, not locked by current thread by node id: b9df1975-5595-42eb-beae-bdc5d67bce49 thread-id: 52
at org.redisson.RedissonLock.lambda$unlockAsync$4(RedissonLock.java:616)
at org.redisson.misc.RedissonPromise.lambda$onComplete$0(RedissonPromise.java:187)
at io.netty.util.concurrent.DefaultPromise.notifyListener0(DefaultPromise.java:578)
at io.netty.util.concurrent.DefaultPromise.notifyListenersNow(DefaultPromise.java:552)
at io.netty.util.concurrent.DefaultPromise.notifyListeners(DefaultPromise.java:491)
at io.netty.util.concurrent.DefaultPromise.addListener(DefaultPromise.java:184)
at org.redisson.misc.RedissonPromise.onComplete(RedissonPromise.java:181)
at org.redisson.RedissonLock.unlockAsync(RedissonLock.java:607)
at org.redisson.RedissonLock.unlock(RedissonLock.java:492)
at com.qsl.ResissonTest.testLock(ResissonTest.java:41)
at java.lang.Thread.run(Thread.java:748)
问题分析
从错误信息中可以看出,当前线程(thread-id: 52)试图释放一个它并没有持有的锁(node id: b9df1975-5595-42eb-beae-bdc5d67bce49)。在Redisson中,每个锁实例都有一个唯一的node id,用于在分布式环境下区分不同的Redisson实例。
这个问题通常发生在以下场景:
- 多线程竞争锁:当多个线程同时竞争同一个锁时,如果一个线程成功获取了锁,而其他线程在finally块中尝试释放锁,就会抛出异常。
- 代码逻辑错误:开发者可能在finally块中无条件地调用unlock方法,而没有检查当前线程是否持有锁。
解决方案
为了解决这个问题,我们可以采取以下几种方法:
(1) 检查锁持有状态:在释放锁之前,先检查当前线程是否持有锁。可以使用lock.isHeldByCurrentThread()方法来判断。
if (lock.isHeldByCurrentThread()) {
lock.unlock();
}
(2) 使用try-finally块:确保获取锁和释放锁的逻辑都在try-finally块中,以防止因异常而未能释放锁。
try {
lock.lock();
// 执行业务逻辑
} finally {
if (lock.isHeldByCurrentThread()) {
lock.unlock();
}
}
(3) 合理设置锁的超时时间:根据业务逻辑的执行时间设置合理的锁超时时间,避免因超时导致锁释放失败。
(4) 增加重试机制:在释放锁的过程中,可以考虑增加重试机制,以应对网络延迟等问题。
(5) 避免动态创建Redisson实例:在代码中,应尽量避免动态创建Redisson实例,而应使用单例模式或依赖注入来管理实例的生命周期。
结论
在分布式系统中使用Redisson实现分布式锁时,必须仔细处理锁的获取和释放逻辑,以防止因线程竞争或代码逻辑错误导致的问题。通过检查锁持有状态、使用try-finally块、合理设置锁的超时时间、增加重试机制以及避免动态创建Redisson实例等方法,可以有效地提高系统的稳定性和可靠性。