本文和大家继续讨论一下Perl线程的生命周期,主要包括共享与同步,锁,信号量和Perl线程队列几部分内容,相信通过本文的学习你对Perl线程生命周期的概念有一定的了解。
共享与同步
threads::shared
和现有大多数Perl线程模型不同,在PerlithreadsPerl线程模型中,默认情况下任何数据结构都不是共享的。当一个新Perl线程被创建以后,它就已经包含了当前所有数据结构的一份私有拷贝,新建Perl线程中对这份拷贝的数据结构的任何操作都不会在其他Perl线程中有效。因此,如果需要使用任何共享的数据,都必须显式地申明。threads::shared包可以用来实现Perl线程间共享数据的目的。
锁
多Perl线程间既然有了共享的数据,那么就必须对共享数据进行小心地访问,否则,冲突在所难免。PerlithreadsPerl线程模型中内置的lock方法实现了Perl线程间共享数据的锁机制。有趣的是,并不存在一个unlock方法用来显式地解锁,锁的生命周期以代码块为单位,也就是说,当lock操作所在的代码块执行结束之后,也就是锁被隐式释放之时。例如
清单10.Perl线程中的锁机制
- usethreads::shared;
- #inthread1
- {
- lock($share);#lockfor3seconds
- sleep(3);#otherthreadscannotlockagain
- }
- #unlockimplicitlynowaftertheblock
- #inthread2
- {
- lock($share);#willbeblocked,asalreadylockedbythread1
- $share++;#afterthread1quitfromtheblock
- }
- #unlockimplicitlynowaftertheblock
上面的示例中,我们在thread1中使用lock方法锁住了一个普通的标量,这会导致thread2在试图获取$share变量的锁时被阻塞,当thread1从调用lock的代码块中退出时,锁被隐式地释放,从而thread2阻塞结束,lock成功以后,thread2才可以执行$share++的操作。对于数组和哈希表来说,lock必须用在整个数据结构上,而不是用在数组或哈希表的某一个元素上。
假如一个Perl线程对某一个共享变量实施了锁操作,在它没有释放锁之前,如果另外一个Perl线程也对这个共享变量实施锁操作,那么这个Perl线程就会被阻塞,阻塞不会被自动中止而是直到前一个Perl线程将锁释放为止。这样的模式就带来了我们常见的死锁问题。
例如
清单12.Perl线程中的死锁
- usethreads;
- usethreads::shared;
- #inthread1
- {
- lock($a);#lockfor3seconds
- sleep(3);#otherthreadscannotlockagain
- lock($b);#deadlockhere
- }
- #inthread2
- {
- lock($b);#willbeblocked,asalreadylockedbythread1
- sleep(3);#afterthread1quitfromtheblock
- lock($a);#deadlockhere
- }
死锁常常是多Perl线程程序中最隐蔽的问题,往往难以发现与调试,也增加了排查问题的难度。为了避免在程序中死锁的问题,在程序中我们应该尽量避免同时获取多个共享变量的锁,如果无法避免,那么一是要尽量使用相同的顺序来获取多个共享变量的锁,另外也要尽可能地细化上锁的粒度,减少上锁的时间。#p#
信号量
Thread::Semaphore包为Perl线程提供了信号量的支持。你可以创建一个自己的信号量,并通过down操作和up操作来实现对资源的同步访问。实际上,down操作和up操作对应的就是我们所熟知的P操作和V操作。从内部实现上看,Thread::Semaphore本质上就是加了锁的共享变量,无非是把这个加了锁的共享变量封装成了一个Perl线程安全的包而已。由于信号量不必与任何变量绑定,因此,它非常灵活,可以用来控制你想同步的任何数据结构和程序行为。例如
清单13.Perl线程中的信号量
- usethreads;
- usethreads::shared;
- useThread::Semaphore;
- my$s=Thread::Semaphore->new();
- $s->down();#Poperation
- ...
- $s->up();#Voperation
从本质上说,信号量是一个共享的整型变量的引用。默认情况下,它的初始值为1,down操作使它的值减1,up操作使它的值加1。当然,你也可以自定义信号量初始值和每次up或down操作时信号量的变化。
Perl线程队列
Thread::Queue包为Perl线程提供了Perl线程安全的队列支持。与信号量类似,从内部实现上看,Thread::Queue也是把一个通过锁机制实现同步访问的共享队列封装成了一个Perl线程安全的包,并提供统一的使用接口。Thread::Queue在某些情况下可以大大简化Perl线程间通信的难度和成本。例如在生产者-消费者模型中,生产者可以不断地在Perl线程队列上做enqueue操作,而消费者只需要不断地在Perl线程队列上做dequeue操作,这就很简单地实现了生产者和消费者之间同步的问题。
其他有用的非核心包
本文前面讨论的所有内容都在Perl线程核心包的范畴之内。其实CPAN上还有其他一些与Perl线程相关的非核心包,它们往往也会给Perl线程的使用带来很大的便利,这里我们选出两个稍加介绍,抛砖引玉。
Thread::Pool包允许你在程序中创建一批Perl线程去完成多个类似的任务。例如当你希望创建一个多Perl线程程序去完成检验1000个ip地址是否都能ping通的任务时,Thread::Pool包可以给你带来便利。
Thread::RWLock包为Perl线程中的读写操作提供了锁机制的支持。例如当你有多个reader和writerPerl线程共同访问某一个或几个文件时,Thread::RWLock包可以给你带来便利。
总结
本文主要介绍了Perl中Perl线程的使用方法,包括Perl线程的创建、执行与消亡,如何在Perl线程中使用共享变量并通过锁机制、信号量和Perl线程队列的方法来实现Perl线程间的同步。PerlithreadsPerl线程模型与主流Perl线程模型***的不同之处在于默认情况下任何数据结构都是非共享的,或者说Perl中的ithreads是一个“非轻量级”的Perl线程模型。虽然这样的Perl线程模型增加了程序的开销,但它并不会在Perl线程的功能性上打折扣,同时它也使得Perl线程间的通讯和共享变得更加简单。这也符合了Perl一贯的简单而强大的理念和原则。
【编辑推荐】