你好,我是码哥,可以叫我靓仔。
线程池是一种用于管理和重用线程的机制,它允许开发人员有效地执行并发任务。通过使用线程池,可以带来了许多好处:
- 资源管理: 线程池能够有效地管理系统资源,通过限制并发任务的数量和重用线程,减少了线程创建和销毁的开销,提高了系统资源利用率。
- 性能提升: 通过合理地配置线程池大小和任务队列,可以优化任务执行流程,降低了线程的上下文切换成本,提高了任务的执行效率和系统的吞吐量。
- 避免资源耗尽: 线程池可以控制并发任务的数量,防止系统因创建过多线程而导致资源耗尽,从而提高了系统的稳定性和可靠性。
- 任务排队: 线程池通过任务队列来暂存尚未执行的任务,保证了任务的顺序执行,并且能够灵活地处理突发任务量,避免了系统的过载。
- 简化并发编程: 使用线程池可以简化并发编程的复杂性,开发人员无需手动管理线程的生命周期和任务的调度,只需将任务提交给线程池即可,从而降低了编程的复杂度和出错的可能性。
接下来以 Java 中的线程池实现机制为例,带你掌握线程池的工作机制。
线程池的工作机制
线程池的工作机制可以看作是一种生产者-消费者模型的应用。
在这个模型中,任务(生产者)被提交到线程池,然后线程池中的线程(消费者)从任务队列中取出任务并执行,线程池模型架构如下图:
- 开发人员使用 ThreadPoolExecutor 的 submit() 方法提交任务。
- 检测线程池运行状态,如果不是 RUNNING,则直接拒绝,线程池要保证在 RUNNING 的状态下执行任务
- 提交的任务(通常实现了 Callable 或 Runnable 接口)会被封装成一个 FutureTask 对象,该对象实现了 Future 接口,允许获取任务执行的结果。
- 如果线程池中的核心线程数小于核心线程池大小(corePoolSize),则尝试创建新的核心线程来执行任务。
- 如果当前核心线程数已经达到 corePoolSize,则将任务放入任务队列中,等待工作线程获取任务执行。
- 如果队列已满,而且当前线程池中的线程数量小于最大线程池大小(maximumPoolSize),则尝试创建新的非核心线程来执行任务。
- 如果当前线程池中的线程数量已经达到最大线程池大小,则根据拒绝策略进行处理。
- 任务执行完成后,线程池将返回一个 Future 对象,通过这个对象可以获取任务执行的结果。
线程池的执行流程图如下所示。
线程池的状态
Java 中的线程池具有不同的状态,这些状态反映了线程池在其生命周期中的不同阶段和行为。主要的线程池状态有以下几种:
状态 | 描述 |
RUNNING(运行中) | 表示线程池正在正常运行,并且可以接受新的任务提交。在这种状态下,线程池可以执行任务,并且可以创建新的线程来处理任务。 |
SHUTDOWN(关闭中) | 表示线程池正在关闭中。在这种状态下,线程池不再接受新的任务提交,但会继续执行已提交的任务,直到所有任务执行完成。 |
STOP(停止) | 表示线程池已经停止,不再接受新的任务提交,并且尝试中断正在执行的任务。 |
TERMINATED(终止) | 表示线程池已经终止,不再接受新的任务提交,并且所有任务已经执行完成。在这种状态下,线程池中的所有线程都已经被销毁。 |
这些状态是通过 ThreadPoolExecutor 类中的 ctl(control)字段来维护的,ctl 是一个 AtomicInteger 类型的变量,它的高 3 位表示线程池的运行状态,低 29 位表示线程池中的工作线程数量。
在 ThreadPoolExecutor 中,通过位运算来修改和检查 ctl 的值,以实现线程池状态的转换和管理。
通过 ctl 字段,ThreadPoolExecutor 类能够高效地维护线程池的状态和线程数量信息,从而实现了对线程池的有效管理和控制。
要注意的是,线程池的状态不是直接设置的,而是通过调用 shutdown()、shutdownNow() 等方法触发状态的转换。
例如,调用 shutdown() 方法会将线程池的状态从 RUNNING 转换为 SHUTDOWN。
拒绝策略
线程池的拒绝策略用于定义当线程池已满并且无法处理新提交的任务时应该采取的行动。以下是 Java 中常见的线程池拒绝策略:
策略名称 | 描述 |
AbortPolicy(默认策略) | 如果线程池已满并且无法接受新任务,则会抛出 RejectedExecutionException 异常。这是默认的拒绝策略。 |
CallerRunsPolicy | 当线程池已满时,会使用提交任务的线程来执行该任务。换句话说,如果无法接受新任务,则会由提交任务的线程自己执行该任务。 |
DiscardPolicy | 当线程池已满时,会丢弃掉无法处理的新任务,而不会抛出异常。 |
DiscardOldestPolicy | 当线程池已满时,会丢弃队列中等待时间最长的任务,然后尝试将新任务加入队列。 |
除了上述标准拒绝策略之外,您还可以实现 RejectedExecutionHandler 接口来定义自定义的拒绝策略。这使您能够根据应用程序的需求实现更复杂的拒绝逻辑。RejectedExecutionHandler 接口:
public interface RejectedExecutionHandler {
void rejectedExecution(Runnable r, ThreadPoolExecutor executor);
}
提交任务给线程池触发线程池的拒绝策略如下图所示。
线程池使用场景
Java 线程池在业务中有许多实践应用,以下是其中一些常见的实践方式:
- Web 服务器:用 Tomcat 作为示例。Tomcat 是一个常见的 Java Web 服务器,它使用线程池来处理传入的 HTTP 请求。每当有一个新的 HTTP 请求到达 Tomcat 服务器时,Tomcat 会从预先配置的线程池中获取一个线程来处理该请求。这样可以有效地管理并发请求,提高服务器的响应速度和稳定性。
- 并发任务处理:许多业务场景需要处理大量的并发任务,例如数据处理、文件上传下载、消息处理等。线程池可以用于并发处理这些任务,提高任务的执行效率和系统的吞吐量。
- 异步处理:在某些业务场景中,需要执行一些耗时的操作,但不想让主线程阻塞。线程池可以用于异步执行这些操作,例如发送邮件、短信通知、数据分析等。通过将任务提交给线程池,主线程可以立即返回,而任务会在后台线程中异步执行。
线程池和连接池的区别
连接池是一组预先初始化和可重复使用的数据库连接。它用于管理到数据库的连接池,允许多个客户端共享和重复使用数据库连接。
连接池有助于通过减少建立和关闭数据库连接的开销来提高数据库密集型应用程序的性能和可伸缩性。
线程池和连接池都是用于提高系统性能和资源利用率的重要技术,但它们的主要区别在于应用场景和管理的资源类型。
线程池用于管理可重复使用的线程资源,以便有效地执行并发任务,而连接池则用于管理可重复使用的数据库连接资源,以便高效地处理数据库访问。
如下图是数据库连接池工作机制。