线程池之路
关于线程和线程池的学习,我们可以从以下几个方面入手:
第一,什么是线程,线程和进程的区别是什么
SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。第二,线程中的基本概念,线程的生命周期
第三,单线程和多线程
第四,线程池的原理解析
第五,线程池应用
一、
线程,程序执行流的最小执行单位,是行程中的实际运作单位,经常容易和进程这个概念混淆。那么,线程和进程究竟有什么区别呢?首先,进程是一个动态的过程,是一个活动的实体。简单来说,一个应用程序的运行就可以被看做是一个进程,而线程,是运行中的实际的任务执行者。可以说,进程中包含了多个可以同时运行的线程。
二、
线程的生命周期,线程的生命周期可以利用以下的图解来更好的理解:
第一步,是用new Thread()的方法新建一个线程,在线程创建完成之后,线程就进入了就绪(Runnable)状态,此时创建出来的线程进入抢占CPU资源的状态,当线程抢到了CPU的执行权之后,线程就进入了运行状态(Running),当该线程的任务执行完成之后或者是非常态的调用的stop()方法之后,线程就进入了死亡状态。而我们在图解中可以看出,线程还具有一个阻塞的过程,这是怎么回事呢?当面对以下几种情况的时候,容易造成线程阻塞,第一种,当线程主动调用了sleep()方法时,线程会进入则阻塞状态,除此之外,当线程中主动调用了阻塞时的IO方法时,这个方法有一个返回参数,当参数返回之前,线程也会进入阻塞状态,还有一种情况,当线程进入正在等待某个通知时,会进入阻塞状态。那么,为什么会有阻塞状态出现呢?我们都知道,CPU的资源是十分宝贵的,所以,当线程正在进行某种不确定时长的任务时,Java就会收回CPU的执行权,从而合理应用CPU的资源。我们根据图可以看出,线程在阻塞过程结束之后,会重新进入就绪状态,重新抢夺CPU资源。这时候,我们可能会产生一个疑问,如何跳出阻塞过程呢?又以上几种可能造成线程阻塞的情况来看,都是存在一个时间限制的,当sleep()方法的睡眠时长过去后,线程就自动跳出了阻塞状态,第二种则是在返回了一个参数之后,在获取到了等待的通知时,就自动跳出了线程的阻塞过程
三、
什么是单线程和多线程?
单线程,顾名思义即是只有一条线程在执行任务,这种情况在我们日常的工作学习中很少遇到,所以我们只是简单做一下了解
多线程,创建多条线程同时执行任务,这种方式在我们的日常生活中比较常见。但是,在多线程的使用过程中,还有许多需要我们了解的概念。比如,在理解上并行和并发的区别,以及在实际应用的过程中多线程的安全问题,对此,我们需要进行详细的了解。
并行和并发:在我们看来,都是可以同时执行多种任务,那么,到底他们二者有什么区别呢?
并发,从宏观方面来说,并发就是同时进行多种事件,实际上,这几种时间,并不是同时进行的,而是交替进行的,而由于CPU的运算速度非常的快,会造成我们的一种错觉,就是在同一时间内进行了多种事件
而并行,则是真正意义上的同时进行多种事件。这种只可以在多核CPU的基础下完成。
还有就是多线程的安全问题?为什么会造成多线程的安全问题呢?我们可以想象一下,如果多个线程同时执行一个任务,那么意味着他们共享同一种资源,由于线程CPU的资源不一定可以被谁抢占到,这是,第一条线程先抢占到CPU资源,他刚刚进行了第一次操作,而此时第二条线程抢占到了CPU的资源,那么,共享资源还来不及发生变化,就同时有两条数据使用了同一条资源,具体请参考多线程买票问题。这个问题我们应该如何解决那?
由造成问题的原因我们可以看出,这个问题主要的矛盾在于,CPU的使用权抢占和资源的共享发生了冲突,解决时,我们只需要让一条线程战歌了CPU的资源时,阻止第二条线程同时抢占CPU的执行权,在代码中,我们只需要在方法中使用同步代码块即可。在这里,同步代码块不多进行赘述,可以自行了解。
四,线程池
由以上介绍我们可以看出,在一个应用程序中,我们需要多次使用线程,也就意味着,我们需要多次创建并销毁线程。而创建并销毁线程的过程势必会消耗内存。而在Java中,内存资源是及其宝贵的,所以,我们就提出了线程池的概念。
线程池:Java中开辟出了一种管理线程的概念,这个概念叫做线程池,从概念以及应用场景中,我们可以看出,线程池的好处,就是可以方便的管理线程,也可以减少内存的消耗。
那么,我们应该如何创建一个线程池那?Java中已经提供了创建线程池的一个类:Executor
而我们创建时,一般使用它的子类:ThreadPoolExecutor.
public ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime, TimeUnit unit, BlockingQueue<Runnable> workQueue, ThreadFactory threadFactory, RejectedExecutionHandler handler)
这是其中最重要的一个构造方法,这个方法决定了创建出来的线程池的各种属性,下面依靠一张图来更好的理解线程池和这几个参数:
由图,我们可以看出,线程池中的corePoolSize就是线程池中的核心线程数量,这几个核心线程,只是在没有用的时候,也不会被回收,maximumPoolSize就是线程池中可以容纳的最大线程的数量,而keepAliveTime,就是线程池中除了核心线程之外的其他的最长可以保留的时间,因为在线程池中,除了核心线程即使在无任务的情况下也不能被清除,其余的都是有存活时间的,意思就是非核心线程可以保留的最长的空闲时间,而util,就是计算这个时间的一个单位,workQueue,就是等待队列,任务可以储存在任务队列中等待被执行,执行的是FIFIO原则(先进先出)。threadFactory,就是创建线程的线程工厂,最后一个handler,是一种拒绝策略,我们可以在任务满了之后,拒绝执行某些任务。
线程池的执行流程又是怎样的呢?
由图我们可以看出,任务进来时,首先执行判断,判断核心线程是否处于空闲状态,如果不是,核心线程就先就执行任务,如果核心线程已满,则判断任务队列是否有地方存放该任务,若果有,就将任务保存在任务队列中,等待执行,如果满了,在判断最大可容纳的线程数,如果没有超出这个数量,就开创非核心线程执行任务,如果超出了,就调用handler实现拒绝策略。
handler的拒绝策略:
有四种:第一种AbortPolicy:不执行新任务,直接抛出异常,提示线程池已满
第二种DisCardPolicy:不执行新任务,也不抛出异常
第三种DisCardOldSetPolicy:将消息队列中的第一个任务替换为当前新进来的任务执行
第四种CallerRunsPolicy:直接调用execute来执行当前任务
五,线程池应用:
1、四种常见的线程池
CachedThreadPool:可缓存的线程池,该线程池中没有核心线程,非核心线程的数量为Integer.max_value,就是无限大,当有需要时创建线程来执行任务,没有需要时回收线程,适用于耗时少,任务量大的情况。
SecudleThreadPool:周期性执行任务的线程池,按照某种特定的计划执行线程中的任务,有核心线程,但也有非核心线程,非核心线程的大小也为无限大。适用于执行周期性的任务。
SingleThreadPool:只有一条线程来执行任务,适用于有顺序的任务的应用场景。
FixedThreadPool:定长的线程池,有核心线程,核心线程的即为最大的线程数量,没有非核心线程
2、线程池简介:
多线程技术主要解决处理器单元内多个线程执行的问题,它可以显著减少处理器单元的闲置时间,增加处理器单元的吞吐能力。
假设一个服务器完成一项任务所需时间为:T1 创建线程时间,T2 在线程中执行任务的时间,T3 销毁线程时间。
如果:T1 + T3 远大于 T2,则可以采用线程池,以提高服务器性能。
一个线程池包括以下四个基本组成部分:
1、线程池管理器(ThreadPool):用于创建并管理线程池,包括 创建线程池,销毁线程池,添加新任务;
2、工作线程(PoolWorker):线程池中线程,在没有任务时处于等待状态,可以循环的执行任务;
3、任务接口(Task):每个任务必须实现的接口,以供工作线程调度任务的执行,它主要规定了任务的入口,任务执行完后的收尾工作,任务的执行状态等;
4、任务队列(taskQueue):用于存放没有处理的任务。提供一种缓冲机制。
线程池技术正是关注如何缩短或调整T1,T3时间的技术,从而提高服务器程序性能的。它把T1,T3分别安排在服务器程序的启动和结束的时间段或者一些空闲的时间段,这样在服务器程序处理客户请求时,不会有T1,T3的开销了。
线程池不仅调整T1,T3产生的时间段,而且它还显著减少了创建线程的数目,看一个例子:
假设一个服务器一天要处理50000个请求,并且每个请求需要一个单独的线程完成。在线程池中,线程数一般是固定的,所以产生线程总数不会超过线程池中线程的数目,而如果服务器不利用线程池来处理这些请求则线程总数为50000。一般线程池大小是远小于50000。所以利用线程池的服务器程序不会为了创建50000而在处理请求时浪费时间,从而提高效率。
代码实现中并没有实现任务接口,而是把Runnable对象加入到线程池管理器(ThreadPool),然后剩下的事情就由线程池管理器(ThreadPool)来完成了
- package mine.util.thread;
- import java.util.LinkedList;
- import java.util.List;
- /**
- * 线程池类,线程管理器:创建线程,执行任务,销毁线程,获取线程基本信息
- */
- public final class ThreadPool {
- // 线程池中默认线程的个数为5
- private static int worker_num = 5;
- // 工作线程
- private WorkThread[] workThrads;
- // 未处理的任务
- private static volatile int finished_task = 0;
- // 任务队列,作为一个缓冲,List线程不安全
- private List<Runnable> taskQueue = new LinkedList<Runnable>();
- private static ThreadPool threadPool;
- // 创建具有默认线程个数的线程池
- private ThreadPool() {
- this(5);
- }
- // 创建线程池,worker_num为线程池中工作线程的个数
- private ThreadPool(int worker_num) {
- ThreadPool.worker_num = worker_num;
- workThrads = new WorkThread[worker_num];
- for (int i = 0; i < worker_num; i++) {
- workThrads[i] = new WorkThread();
- workThrads[i].start();// 开启线程池中的线程
- }
- }
- // 单态模式,获得一个默认线程个数的线程池
- public static ThreadPool getThreadPool() {
- return getThreadPool(ThreadPool.worker_num);
- }
- // 单态模式,获得一个指定线程个数的线程池,worker_num(>0)为线程池中工作线程的个数
- // worker_num<=0创建默认的工作线程个数
- public static ThreadPool getThreadPool(int worker_num1) {
- if (worker_num1 <= 0)
- worker_num1 = ThreadPool.worker_num;
- if (threadPool == null)
- threadPool = new ThreadPool(worker_num1);
- return threadPool;
- }
- // 执行任务,其实只是把任务加入任务队列,什么时候执行有线程池管理器觉定
- public void execute(Runnable task) {
- synchronized (taskQueue) {
- taskQueue.add(task);
- taskQueue.notify();
- }
- }
- // 批量执行任务,其实只是把任务加入任务队列,什么时候执行有线程池管理器觉定
- public void execute(Runnable[] task) {
- synchronized (taskQueue) {
- for (Runnable t : task)
- taskQueue.add(t);
- taskQueue.notify();
- }
- }
- // 批量执行任务,其实只是把任务加入任务队列,什么时候执行有线程池管理器觉定
- public void execute(List<Runnable> task) {
- synchronized (taskQueue) {
- for (Runnable t : task)
- taskQueue.add(t);
- taskQueue.notify();
- }
- }
- // 销毁线程池,该方法保证在所有任务都完成的情况下才销毁所有线程,否则等待任务完成才销毁
- public void destroy() {
- while (!taskQueue.isEmpty()) {// 如果还有任务没执行完成,就先睡会吧
- try {
- Thread.sleep(10);
- } catch (InterruptedException e) {
- e.printStackTrace();
- }
- }
- // 工作线程停止工作,且置为null
- for (int i = 0; i < worker_num; i++) {
- workThrads[i].stopWorker();
- workThrads[i] = null;
- }
- threadPool=null;
- taskQueue.clear();// 清空任务队列
- }
- // 返回工作线程的个数
- public int getWorkThreadNumber() {
- return worker_num;
- }
- // 返回已完成任务的个数,这里的已完成是只出了任务队列的任务个数,可能该任务并没有实际执行完成
- public int getFinishedTasknumber() {
- return finished_task;
- }
- // 返回任务队列的长度,即还没处理的任务个数
- public int getWaitTasknumber() {
- return taskQueue.size();
- }
- // 覆盖toString方法,返回线程池信息:工作线程个数和已完成任务个数
- @Override
- public String toString() {
- return "WorkThread number:" + worker_num + " finished task number:"
- + finished_task + " wait task number:" + getWaitTasknumber();
- }
- /**
- * 内部类,工作线程
- */
- private class WorkThread extends Thread {
- // 该工作线程是否有效,用于结束该工作线程
- private boolean isRunning = true;
- /*
- * 关键所在啊,如果任务队列不空,则取出任务执行,若任务队列空,则等待
- */
- @Override
- public void run() {
- Runnable r = null;
- while (isRunning) {// 注意,若线程无效则自然结束run方法,该线程就没用了
- synchronized (taskQueue) {
- while (isRunning && taskQueue.isEmpty()) {// 队列为空
- try {
- taskQueue.wait(20);
- } catch (InterruptedException e) {
- e.printStackTrace();
- }
- }
- if (!taskQueue.isEmpty())
- r = taskQueue.remove(0);// 取出任务
- }
- if (r != null) {
- r.run();// 执行任务
- }
- finished_task++;
- r = null;
- }
- }
- // 停止工作,让该线程自然执行完run方法,自然结束
- public void stopWorker() {
- isRunning = false;
- }
- }
- }
测试代码:
- package mine.util.thread;
- //测试线程池
- public class TestThreadPool {
- public static void main(String[] args) {
- // 创建3个线程的线程池
- ThreadPool t = ThreadPool.getThreadPool(3);
- t.execute(new Runnable[] { new Task(), new Task(), new Task() });
- t.execute(new Runnable[] { new Task(), new Task(), new Task() });
- System.out.println(t);
- t.destroy();// 所有线程都执行完成才destory
- System.out.println(t);
- }
- // 任务类
- static class Task implements Runnable {
- private static volatile int i = 1;
- @Override
- public void run() {// 执行任务
- System.out.println("任务 " + (i++) + " 完成");
- }
- }
- }
运行结果:
WorkThread number:3 finished task number:0 wait task number:6
任务 1 完成
任务 2 完成
任务 3 完成
任务 4 完成
任务 5 完成
任务 6 完成
WorkThread number:3 finished task number:6 wait task number:0
分析:由于并没有任务接口,传入的可以是自定义的任何任务,所以线程池并不能准确的判断该任务是否真正的已经完成(真正完成该任务是这个任务的run方法执行完毕),只能知道该任务已经出了任务队列,正在执行或者已经完成。
2、java类库中提供的线程池简介:
java提供的线程池更加强大,相信理解线程池的工作原理,看类库中的线程池就不会感到陌生了。
