进程与线程,在面试中经常会被问到,或者实际开发中经常遇到。那什么是进程?什么是线程?你对他们了解有多少?
我们经常会说:
1、一个在内存中运行的应用程序。每个进程都有自己独立的一块内存空间,一个进程可以有多个线程。
2、进程是资源分配的独立单位,线程是资源调度的独立单位。
进程。下图显示了 4 个程序创建了 4 个进程,这 4 个进程可以并发地执行。
线程。QQ 和浏览器是两个进程,浏览器进程里面有很多线程,例如 HTTP 请求线程、事件响应线程、渲染线程等等,线程的并发执行使得在浏览器中点击一个新链接从而发起 HTTP 请求时,浏览器还可以响应用户的其它事件。
如果仅仅回答到这里,可能一个大学毕业生就能这么回答,那我们是不是需要深入一下,再深入一下。
比如说:
1、资源开销方面。线程和进程的切换的资源开销情况怎么样?
2、内存分配方面。进程/线程的内存分配情况怎么样?
3、影响程度方面。进程/线程奔溃会造成什么样的影响?
4、执行过程方面。进程/线程执行过程是什么样的?
5、我们没有说进程之间是否可以通信?线程之间是否可以通信?如何可以通信的话,他们是怎么进行通信的?
6、进程同步又是什么?
一、资源开销
(1)每一个进程都有独立的代码和内存空间,多个进程相互切换会消耗比较大的资源。
进程切换如下图:
说明:
- 就绪状态(ready):等待被调度
- 运行状态(running)
- 阻塞状态(waiting):等待资源
如果再往下说的话需要聊聊进程调度算法,比如:先来先服务(FCFS),短作业优先(SJF),最短剩余时间优先,时间片轮转,优先级调度,多级反馈队列等等。
(2)同一类线程共享代码和内存空间,每一个线程都有独立的运行栈和程序计数器,多个线程相互切换消耗比较小。
二、内存分配
(1)进程之间的地址空间和资源是相互独立的。
(2)同一进程的线程共享本进程的地址空间和资源。
三、影响程度
(1)进程一旦奔溃,只会影响到该进程的程序奔溃,其他进程不受影响。
(2)线程一旦奔溃,会影响到使用该线程的进程都会受到影响。
(3)进程要比线程要健壮。
四、执行过程
(1)每一个进程都有独立的运行入口,执行顺序,程序的出口,提供线程控制,进程可以并发执行。
(2)线程不能单独运行,必须依赖于进程中执行。线程可以并发执行。
五、进程之间的通信
(1)管道(PIPE)
有名管道:一种半双工的通信方式,它允许无亲缘关系进程间的通信。
优点:可以实现任意关系的进程间的通信
缺点:
- 长期存于系统中,使用不当容易出错。
- 缓冲区有限。
无名管道:一种半双工的通信方式,只能在具有亲缘关系的进程间使用(父子进程)。
优点:简单方便。
缺点:
- 局限于单向通信。
- 只能创建在它的进程以及其有亲缘关系的进程之间。
- 缓冲区有限。
(2)信号量(Semaphore):一个计数器,可以用来控制多个线程对共享资源的访问。
优点:可以同步进程。
缺点:信号量有限。
(3)信号(Signal):一种比较复杂的通信方式,用于通知接收进程某个事件已经发生。
(4)消息队列(Message Queue):是消息的链表,存放在内核中并由消息队列标识符标识。
优点:可以实现任意进程间的通信,并通过系统调用函数来实现消息发送和接收之间的同步,无需考虑同步问题,方便。
缺点:信息的复制需要额外消耗 CPU 的时间,不适宜于信息量大或操作频繁的场合。
(5)共享内存(Shared Memory):映射一段能被其他进程所访问的内存,这段共享内存由一个进程创建,但多个进程都可以访问。
优点:无须复制,快捷,信息量大。
缺点:1.通信是通过将共享空间缓冲区直接附加到进程的虚拟地址空间中来实现的,因此进程间的读写操作的同步问题2.利用内存缓冲区直接交换信息,内存的实体存在于计算机中,只能同一个计算机系统中的诸多进程共享,不方便网络通信。
(6)套接字(Socket):可用于不同计算机间的进程通信
优点:
- 传输数据为字节级,传输数据可自定义,数据量小效率高。
- 传输数据时间短,性能高。
- 适合于客户端和服务器端之间信息实时交互。
- 可以加密,数据安全性强。
缺点:需对传输的数据进行解析,转化成应用级的数据。
六、线程之间的通信
(1)锁机制:包括互斥锁/量(mutex)、读写锁(reader-writer lock)、自旋锁(spin lock)、条件变量(condition)。
- 互斥锁/量(mutex):提供了以排他方式防止数据结构被并发修改的方法。
- 读写锁(reader-writer lock):允许多个线程同时读共享数据,而对写操作是互斥的。
- 自旋锁(spin lock)与互斥锁类似,都是为了保护共享资源。互斥锁是当资源被占用,申请者进入睡眠状态;而自旋锁则循环检测保持者是否已经释放锁。
- 条件变量(condition):可以以原子的方式阻塞进程,直到某个特定条件为真为止。对条件的测试是在互斥锁的保护下进行的。条件变量始终与互斥锁一起使用。
(2)信号量机制(Semaphore)。
- 无名线程信号量
- 命名线程信号量
(3)信号机制(Signal):类似进程间的信号处理。
(4)屏障(barrier):屏障允许每个线程等待,直到所有的合作线程都达到某一点,然后从该点继续执行。
七、对比/优劣/选择
选择
- 需要频繁创建销毁的优先用线程。
- 需要进行大量计算的优先使用线程。
- 强相关的处理用线程,弱相关的处理用进程。
- 可能要扩展到多机分布的用进程,多核分布的用线程。
- 都满足需求的情况下,用你最熟悉、最拿手的方式就对了。