您的当前位置:首页正文

Java线程池ThreadPoolExecutor实现原理剖析

2024-12-18 来源:东饰资讯网

继承结构

继承结构看起来很清晰,最顶层的Executor只提供了一个最简单的void execute(Runnable command)方法,然后是ExecutorService,ExecutorService提供了一些管理相关的方法,例如关闭、判断当前线程池的状态等,另外不同于Executor#execute,ExecutorService提供了一系列方法,可以将任务包装成一个Future,从而使得任务提交方可以跟踪任务的状态。而父类AbstractExecutorService则提供了一些默认的实现。

构造器

ThreadPoolExecutor的构造器提供了非常多的参数,每一个参数都非常的重要,一不小心就容易踩坑,因此设置的时候,你必须要知道自己在干什么。

publicThreadPoolExecutor(intcorePoolSize,intmaximumPoolSize,longkeepAliveTime,TimeUnitunit,BlockingQueueworkQueue,ThreadFactorythreadFactory,RejectedExecutionHandlerhandler) {if(corePoolSize<0||maximumPoolSize<=0||maximumPoolSize

corePoolSize、 maximumPoolSize。线程池会自动根据corePoolSize和maximumPoolSize去调整当前线程池的大小。当你通过submit或者execute方法提交任务的时候,如果当前线程池的线程数小于corePoolSize,那么线程池就会创建一个新的线程处理任务, 即使其他的core线程是空闲的。如果当前线程数大于corePoolSize并且小于maximumPoolSize,那么只有在队列"满"的时候才会创建新的线程。因此这里会有很多的坑,比如你的core和max线程数设置的不一样,希望请求积压在队列的时候能够实时的扩容,但如果制定了一个无界队列,那么就不会扩容了,因为队列不存在满的概念。

keepAliveTime。如果当前线程池中的线程数超过了corePoolSize,那么如果在keepAliveTime时间内都没有新的任务需要处理,那么超过corePoolSize的这部分线程就会被销毁。默认情况下是不会回收core线程的,可以通过设置allowCoreThreadTimeOut改变这一行为。

workQueue。即实际用于存储任务的队列,这个可以说是最核心的一个参数了,直接决定了线程池的行为,比如说传入一个有界队列,那么队列满的时候,线程池就会根据core和max参数的设置情况决定是否需要扩容,如果传入了一个SynchronousQueue,这个队列只有在另一个线程在同步remove的时候才可以put成功,对应到线程池中,简单来说就是如果有线程池任务处理完了,调用poll或者take方法获取新的任务的时候,新提交的任务才会put成功,否则如果当前的线程都在忙着处理任务,那么就会put失败,也就会走扩容的逻辑,如果传入了一个DelayedWorkQueue,顾名思义,任务就会根据过期时间来决定什么时候弹出,即为ScheduledThreadPoolExecutor的机制。

threadFactory。创建线程都是通过ThreadFactory来实现的,如果没指定的话,默认会使用Executors.defaultThreadFactory(),一般来说,我们会在这里对线程设置名称、异常处理器等。

handler。即当任务提交失败的时候,会调用这个处理器,ThreadPoolExecutor内置了多个实现,比如抛异常、直接抛弃等。这里也需要根据业务场景进行设置,比如说当队列积压的时候,针对性的对线程池扩容或者发送告警等策略。

看完这几个参数的含义,我们看一下Executors提供的一些工具方法,只要是为了方便使用,但是我建议最好少用这个类,而是直接用ThreadPoolExecutor的构造函数,多了解一下这几个参数到底是什么意思,自己的业务场景是什么样的,比如线程池需不需要扩容、用不用回收空闲的线程等。

publicclassExecutors{/*    * 提供一个固定大小的线程池,并且线程不会回收,由于传入的是一个无界队列,相当于队列永远不会满    * 也就不会扩容,因此需要特别注意任务积压在队列中导致内存爆掉的问题*/publicstaticExecutorServicenewFixedThreadPool(intnThreads) {returnnewThreadPoolExecutor(nThreads, nThreads,0L,TimeUnit.MILLISECONDS,newLinkedBlockingQueue());    }/*    *  这个线程池会一直扩容,由于SynchronousQueue的特性,如果当前所有的线程都在处理任务,那么    *  新的请求过来,就会导致创建一个新的线程处理任务。如果线程一分钟没有新任务处理,就会被回    *  收掉。特别注意,如果每一个任务都比较耗时,并发又比较高,那么可能每次任务过来都会创建一个线    *  程*/publicstaticExecutorServicenewCachedThreadPool() {returnnewThreadPoolExecutor(0,Integer.MAX_VALUE,60L,TimeUnit.SECONDS,newSynchronousQueue());    }}

源码分析

既然是个线程池,那就必然有其生命周期:运行中、关闭、停止等。ThreadPoolExecutor是用一个AtomicInteger去的前三位表示这个状态的,另外又重用了低29位用于表示线程数,可以支持最大大概5亿多,绝逼够用了,如果以后硬件真的发展到能够启动这么多线程,改成AtomicLong就可以了。

状态这里主要分为下面几种:

RUNNING: 表示当前线程池正在运行中,可以接受新任务以及处理队列中的任务

SHUTDOWN: 不再接受新的任务,但会继续处理队列中的任务

STOP: 不再接受新的任务,也不处理队列中的任务了,并且会中断正在进行中的任务

TIDYING: 所有任务都已经处理完毕,线程数为0,转为为TIDYING状态之后,会调用terminated()回调

TERMINATED: terminated()已经执行完毕

同时我们可以看到所有的状态都是用二进制位表示的,并且依次递增,从而方便进行比较,比如想获取当前状态是否至少为SHUTDOWN等,同时状态之前有几种转换:

RUNNING -> SHUTDOWN。调用了shutdown()之后,或者执行了finalize()

(RUNNING 或者 SHUTDOWN) -> STOP。调用了shutdownNow()之后会转换这个状态

SHUTDOWN -> TIDYING。当线程池和队列都为空的时候

STOP -> TIDYING。当线程池为空的时候

IDYING -> TERMINATED。执行完terminated()回调之后会转换为这个状态

privatefinalAtomicIntegerctl=newAtomicInteger(ctlOf(RUNNING,0));privatestaticfinalintCOUNT_BITS=Integer.SIZE-3;privatestaticfinalintCAPACITY=(1<=s;    }privatestaticbooleanisRunning(intc) {returnc

下面是比较核心的字段,这里workers采用的是非线程安全的HashSet, 而不是线程安全的版本,主要是因为这里有些复合的操作,比如说将worker添加到workers后,我们还需要判断是否需要更新largestPoolSize等,workers只在获取到mainLock的情况下才会进行读写,另外这里的mainLock也用于在中断线程的时候串行执行,否则如果不加锁的话,可能会造成并发去中断线程,引起不必要的中断风暴。

privatefinalReentrantLockmainLock=newReentrantLock();privatefinalHashSetworkers=newHashSet();privatefinalConditiontermination=mainLock.newCondition();privateintlargestPoolSize;privatelongcompletedTaskCount;

核心方法

拿到一个线程池之后,我们就可以开始提交任务,让它去执行了,那么我们看一下submit方法是如何实现的。

publicFuturesubmit(Runnabletask) {if(task==null)thrownewNullPointerException();RunnableFutureftask=newTaskFor(task,null);        execute(ftask);returnftask;    }publicFuturesubmit(Callabletask) {if(task==null)thrownewNullPointerException();RunnableFutureftask=newTaskFor(task);        execute(ftask);returnftask;    }

这两个方法都很简单,首先将提交过来的任务(有两种形式:Callable、Runnable )都包装成统一的 RunnableFuture,然后调用execute方法,execute可以说是线程池最核心的一个方法。

publicvoidexecute(Runnablecommand) {if(command==null)thrownewNullPointerException();intc=ctl.get();/*            获取当前worker的数目,如果小于corePoolSize那么就扩容,            这里不会判断是否已经有core线程,而是只要小于corePoolSize就会直接增加worker*/if(workerCountOf(c)

这里要特别注意下防止队列失败的逻辑,不同的队列丢任务的逻辑也不一样,例如说无界队列,那么就永远不会put失败,也就是说扩容也永远不会执行,如果是有界队列,那么当队列满的时候,会扩容非core线程,如果是SynchronousQueue,这个队列比较特殊,当有另外一个线程正在同步获取任务的时候,你才能put成功,因此如果当前线程池中所有的worker都忙着处理任务的时候,那么后续的每次新任务都会导致扩容, 当然如果worker没有任务处理了,阻塞在获取任务这一步的时候,新任务的提交就会直接丢到队列中去,而不会扩容。

上文中多次提到了扩容,那么我们下面看一下线程池具体是如何进行扩容的:

privatebooleanaddWorker(RunnablefirstTask,booleancore) {        retry:for(;;) {intc=ctl.get();//获取当前线程池的状态intrs=runStateOf(c);/*                如果状态为大于SHUTDOWN, 比如说STOP,STOP上文说过队列中的任务不处理了,也不接受新任务,                因此可以直接返回false不扩容了,如果状态为SHUTDOWN并且firstTask为null,同时队列非空,                那么就可以扩容*/if(rs>=SHUTDOWN&&!(rs==SHUTDOWN&&firstTask==null&&!workQueue.isEmpty()))returnfalse;for(;;) {intwc=workerCountOf(c);/*                    若worker的数目大于CAPACITY则直接返回,                    然后根据要扩容的是core线程还是非core线程,进行判断worker数目                    是否超过设置的值,超过则返回*/if(wc>=CAPACITY||wc>=(core?corePoolSize:maximumPoolSize))returnfalse;/*                    通过CAS的方式自增worker的数目,成功了则直接跳出循环*/if(compareAndIncrementWorkerCount(c))breakretry;//重新读取状态变量,如果状态改变了,比如线程池关闭了,那么就跳到最外层的for循环,//注意这里跳出的是retry。c=ctl.get();//Re-read ctlif(runStateOf(c)!=rs)continueretry;//else CAS failed due to workerCount change; retry inner loop}        }booleanworkerStarted=false;booleanworkerAdded=false;Workerw=null;try{//创建Workerw=newWorker(firstTask);finalThreadt=w.thread;if(t!=null) {finalReentrantLockmainLock=this.mainLock;                mainLock.lock();try{/*                        获取锁,并判断线程池是否已经关闭*/intrs=runStateOf(ctl.get());if(rslargestPoolSize)//更新largestPoolSizelargestPoolSize=s;                        workerAdded=true;                    }                }finally{                    mainLock.unlock();                }if(workerAdded) {//若Worker创建成功,则启动线程,这么时候worker就会开始执行任务了t.start();                    workerStarted=true;                }            }        }finally{if(!workerStarted)//添加失败addWorkerFailed(w);        }returnworkerStarted;    }privatevoidaddWorkerFailed(Workerw) {finalReentrantLockmainLock=this.mainLock;        mainLock.lock();try{if(w!=null)                workers.remove(w);            decrementWorkerCount();//每次减少worker或者从队列中移除任务的时候都需要调用这个方法tryTerminate();        }finally{            mainLock.unlock();        }    }

这里有个貌似不太起眼的方法tryTerminate,这个方法会在所有可能导致线程池终结的地方调用,比如说减少worker的数目等,如果满足条件的话,那么将线程池转换为TERMINATED状态。另外这个方法没有用private修饰,因为ScheduledThreadPoolExecutor继承自ThreadPoolExecutor,而ScheduledThreadPoolExecutor也会调用这个方法。

Worker

下面看一下Worker类,也就是这个类实际负责执行任务,Worker类继承自AbstractQueuedSynchronizer,AQS可以理解为一个同步框架,提供了一些通用的机制,利用模板方法模式,让你能够原子的管理同步状态、blocking和unblocking线程、以及队列,具体的内容之后有时间会再写,还是比较复杂的。这里Worker对AQS的使用相对比较简单,使用了状态变量state表示是否获得锁,0表示解锁、1表示已获得锁,同时通过exclusiveOwnerThread存储当前持有锁的线程。另外再简单提一下,比如说CountDownLatch, 也是基于AQS框架实现的,countdown方法递减state,await阻塞等待state为0。

privatefinalclassWorkerextendsAbstractQueuedSynchronizerimplementsRunnable{/** Thread this worker is running in.  Null if factory fails.*/finalThreadthread;/** Initial task to run.  Possibly null.*/RunnablefirstTask;/** Per-thread task counter*/volatilelongcompletedTasks;Worker(RunnablefirstTask) {            setState(-1);//inhibit interrupts until runWorkerthis.firstTask=firstTask;this.thread=getThreadFactory().newThread(this);        }/** Delegates main run loop to outer runWorker*/publicvoidrun() {            runWorker(this);        }protectedbooleanisHeldExclusively() {returngetState()!=0;        }protectedbooleantryAcquire(intunused) {if(compareAndSetState(0,1)) {                setExclusiveOwnerThread(Thread.currentThread());returntrue;            }returnfalse;        }protectedbooleantryRelease(intunused) {            setExclusiveOwnerThread(null);            setState(0);returntrue;        }publicvoidlock()        { acquire(1); }publicbooleantryLock()  {returntryAcquire(1); }publicvoidunlock()      { release(1); }publicbooleanisLocked() {returnisHeldExclusively(); }voidinterruptIfStarted() {Threadt;if(getState()>=0&&(t=thread)!=null&&!t.isInterrupted()) {try{                    t.interrupt();                }catch(SecurityExceptionignore) {                }            }        }    }

注意这里Worker初始化的时候,会通过setState(-1)将state设置为-1,并在runWorker()方法中置为0,上文说过Worker是利用state这个变量来表示锁的状态,那么加锁的操作就是通过CAS将state从0改成1,那么初始化的时候改成-1,也就是表示在Worker启动之前,都不允许加锁操作,我们再看interruptIfStarted()以及interruptIdleWorkers()方法,这两个方法在尝试中断Worker之前,都会先加锁或者判断state是否大于0,因此这里的将state设置为-1,就是为了禁止中断操作,并在runWorker中置为0,也就是说只能在Worker启动之后才能够中断Worker。

另外线程启动之后,其实就是调用了runWorker方法,下面我们看一下具体是如何实现的。

关闭线程池

关闭线程池一般有两种形式,shutdown()和shutdownNow()

publicvoidshutdown() {finalReentrantLockmainLock=this.mainLock;        mainLock.lock();try{            checkShutdownAccess();//通过CAS将状态更改为SHUTDOWN,这个时候线程池不接受新任务,但会继续处理队列中的任务advanceRunState(SHUTDOWN);//中断所有空闲的worker,也就是说除了正在处理任务的worker,其他阻塞在getTask()上的worker//都会被中断interruptIdleWorkers();//执行回调onShutdown();//hook for ScheduledThreadPoolExecutor}finally{            mainLock.unlock();        }        tryTerminate();//这个方法不会等待所有的任务处理完成才返回}publicListshutdownNow() {Listtasks;finalReentrantLockmainLock=this.mainLock;        mainLock.lock();try{            checkShutdownAccess();/*                不同于shutdown(),会转换为STOP状态,不再处理新任务,队列中的任务也不处理,                而且会中断所有的worker,而不只是空闲的worker*/advanceRunState(STOP);            interruptWorkers();            tasks=drainQueue();//将所有的任务从队列中弹出}finally{            mainLock.unlock();        }        tryTerminate();returntasks;    }privateListdrainQueue() {BlockingQueueq=workQueue;ArrayListtaskList=newArrayList();/*            将队列中所有的任务remove掉,并添加到taskList中,            但是有些队列比较特殊,比如说DelayQueue,如果第一个任务还没到过期时间,则不会弹出,            因此这里通过调用toArray方法,然后再一个一个的remove掉*/q.drainTo(taskList);if(!q.isEmpty()) {for(Runnabler:q.toArray(newRunnable[0])) {if(q.remove(r))                    taskList.add(r);            }        }returntaskList;    }

从上文中可以看到,调用了shutdown()方法后,不会等待所有的任务处理完毕才返回,因此需要调用awaitTermination()来实现

publicbooleanawaitTermination(longtimeout,TimeUnitunit)        throwsInterruptedException{longnanos=unit.toNanos(timeout);finalReentrantLockmainLock=this.mainLock;        mainLock.lock();try{for(;;) {//线程池若已经终结了,那么就返回if(runStateAtLeast(ctl.get(),TERMINATED))returntrue;//若超时了,也返回掉if(nanos<=0)returnfalse;//阻塞在信号量上,等待线程池终结,但是要注意这个方法可能会因为一些未知原因随时唤醒当前线程,//因此需要重试,在tryTerminate()方法中,执行完terminated()回调后,表明线程池已经终结了,//然后会通过termination.signalAll()唤醒当前线程nanos=termination.awaitNanos(nanos);            }        }finally{            mainLock.unlock();        }    }

一些统计相关的方法

总结

显示全文