一些开发人员明确指示Python虚拟机创建新的线程,Python就能意识到用户需要多线程的支持,如果没有前期的这些支持,不知道Python虚拟机能不能顺利的发展下去。
Python虚拟机的thread module所提供的接口中,一定不能少的肯定是创建线程的接口,倘若没有这个接口,生活还有什么意义呢J?在上面的thread1.py中,我们正是通过其提供的start_new_thread创建了一个崭新的线程。好,我们就进入这个start_new_ thread,看看Python是如何进行创世纪的工作的:
- [thread_nt.h]
- int PyThread_acquire_lock(PyThread_type_lock aLock, int waitflag)
- {
- int success ;
- success = aLock && EnterNonRecursiveMutex((PNRMUTEX) aLock, (waitflag
- == 1 ? INFINITE : 0)) == WAIT_OBJECT_0 ;
- return success;
- }
- DWORD EnterNonRecursiveMutex(PNRMUTEX mutex, BOOL wait)
- {
- /* Assume that the thread waits successfully */
- DWORD ret;
- /* InterlockedIncrement(&mutex->owned) == 0 means that no thread
- currently owns the mutex */
- if (!wait)
- {
- if (InterlockedCompareExchange((PVOID *)&mutex->owned, (PVOID)0,
- (PVOID)-1) != (PVOID)-1)
- return WAIT_TIMEOUT ;
- ret = WAIT_OBJECT_0 ;
- }
- else
- ret = InterlockedIncrement(&mutex->owned) ?
- /* Some thread owns the mutex, let's wait... */
- WaitForSingleObject(mutex->hevent, INFINITE) : WAIT_OBJECT_0 ;
- mutex->thread_id = GetCurrentThreadId() ; /* We own it */
- return ret ;
- }
在代码清单中,我们注意到boot->interp中保存了Python的PyInter- preterState对象,这个对象中携带了Python的module pool这样的全局信息,Python中所有的thread都会共享这些全局信息。
关于代码清单15-1的[2]处所示的多线程环境的初始化动作,有一点需要特别说明,当Python启动时,是并不支持多线程的。换句话说,Python中支持多线程的数据结构以及GIL都是没有创建的,Python之所以有这种行为是因为大多数的Python程序都不需要多线程的支持。
假如一个简单地统计词频的Python脚本中居然出现了多线程,面对这样的代码,我们一定都会抓狂的J。
对多线程的支持并非是没有代价的。最简单的一点,如果激活多线程机制,而执行的Python程序中并没有多线程,那么在100条指令之后,Python虚拟机同样会激活线程的调度。
而如果不激活多线程,Python虚拟机则不用做这些无用功。所以Python选择了让用户激活多线程机制的策略。在Python虚拟机启动时,多线程机制并没有被激活,它只支持单线程,一旦用户调用thread.start_new_thread。
明确指示Python虚拟机创建新的线程,Python就能意识到用户需要多线程的支持,这个时候,Python虚拟机会自动建立多线程机制需要的数据结构、环境以及那个至关重要的GIL。
在这里,我们终于看到了Python中多线程机制的平台相关性,在Python25\Python目录下,有一大批thread_***.h这样的文件。这些文件中,包装了不同操作系统的原生线程,并通过统一的接口暴露给Python,比如这里的PyThread_allocate_lock就是这样一个接口。
我们这里的thread_nt.h中包装的是Win32平台的原生thread,在本章中后面的代码剖析中,还会有大量与平台相关的代码,我们都以Win32平台为例。在PyThread_allocate_lock中,与PyEval_InitThreads非常类似的,它会检查一个initialized的变量,如果说GIL指示着Python的多线程环境是否已经建立。
那么这个initialized变量就指示着为了使用底层平台所提供的原生thread,必须的初始化动作是否完成。这些必须的初始化动作通常都是底层操作系统所提供的API,不同的操作系统可能需要不同的初始化动作。
【编辑推荐】