自旋锁
自旋锁(spin lock)是一个典型的对临界资源的互斥手段,自旋锁是基于CAS原语的,所以它是轻量级的同步操作,它的名称来源于它的特性。自旋锁是指当一个线程尝试获取某个锁时,如果该锁已被其他线程占用,就一直循环检测锁是否被释放,而不是进入线程挂起或睡眠状态。由于自旋锁只不进行线程状态的改变(挂起线程),所以当线程竞争不激烈时,它的响应速度极快(因为避免了线程调度的上下文切换
)。自旋锁适用于锁保护的临界区很小的情况,线程竞争不激烈的场景下。如果线程之间竞争激烈或者临界区的操作特别耗时,那么线程的自旋操作就会耗费大量的cpu资源,所以这种情况下性能就会下降明显。
简单自旋锁
public class SimpleSpinLock { private AtomicReference<Thread> owner = new AtomicReference<Thread>();
public void lock() { Thread currentThread = Thread.currentThread(); while (!owner.compareAndSet(null, currentThread)) { } }
public void unlock() { Thread currentThread = Thread.currentThread(); owner.compareAndSet(currentThread, null); } }
|
缺点
Ticket Lock
public class TicketLock { private AtomicInteger serviceNum = new AtomicInteger(); private AtomicInteger ticketNum = new AtomicInteger();
public int lock() { int myTicketNum = ticketNum.getAndIncrement();
while (serviceNum.get() != myTicketNum) { } return myTicketNum; }
public void unlock(int myTicket) { int next = myTicket + 1; serviceNum.compareAndSet(myTicket, next); } }
|
缺点
Ticket Lock 虽然解决了公平性的问题,但是多处理器系统上,每个进程/线程占用的处理器都在读写同一个变量serviceNum ,每次读写操作都必须在多个处理器缓存之间进行缓存同步,这会导致繁重的系统总线和内存的流量,大大降低系统整体的性能。
CLH锁
CLH的发明人是:Craig,Landin and Hagersten,三个人的名字合称
CLH锁是一种基于隐式链表(节点里面没有next指针)的可扩展、高性能、公平的自旋锁,申请线程只在本地变量上自旋,它不断轮询前驱的状态,如果发现前驱释放了锁就结束自旋。
public class CLHLock { public static class CLHNode { private volatile boolean isLocked = true; }
private volatile CLHNode tail ;
private static final AtomicReferenceFieldUpdater<CLHLock, CLHNode> UPDATER = AtomicReferenceFieldUpdater . newUpdater(CLHLock.class, CLHNode .class , "tail" );
public void lock(CLHNode currentThreadNode) { CLHNode preNode = UPDATER.getAndSet( this, currentThreadNode); if(preNode != null) { while(preNode.isLocked ) { } } }
public void unlock(CLHNode currentThreadNode) { if (!UPDATER.compareAndSet(this, currentThreadNode, null)) { currentThreadNode.isLocked = false ; } } }
|
这里用到了原子字段更新器
,让tail变量可以具有CAS的功能,具体可以参考之前的文章CAS与原子变量
缺点
先说一下NUMA
和SMP
两种处理器结构
SMP(Symmetric Multi-Processor),即对称多处理器结构,指服务器中多个CPU对称工作,每个CPU访问内存地址所需时间相同。其主要特征是共享,包含对CPU,内存,I/O等进行共享。SMP的优点是能够保证内存一致性
,缺点是这些共享的资源很可能成为性能瓶颈,随着CPU数量的增加,每个CPU都要访问相同的内存资源,可能导致内存访问冲突,可能会导致CPU资源的浪费。常用的PC机就属于这种。
NUMA(Non-Uniform Memory Access)非一致存储访问,将CPU分为CPU模块,每个CPU模块由多个CPU组成,并且具有独立的本地内存、I/O槽口等,模块之间可以通过互联模块相互访问,访问本地内存的速度将远远高于访问远地内存(系统内其它节点的内存)的速度
,这也是非一致存储访问NUMA的由来。NUMA优点是可以较好地解决原来SMP系统的扩展问题,缺点是由于访问远地内存的延时远远超过本地内存,因此当CPU数量增加时,系统性能无法线性增加。
CLH锁的缺点是在NUMA系统结构下性能很差,在这种系统结构下,每个线程有自己的内存,如果前趋结点的内存位置比较远,自旋判断前趋结点的locked域,性能将大打折扣,在SMP架构下能够保证内存一致性所以自旋判断较快
MCS锁
MCS Spinlock是一种基于显式链表(节点里面拥有next指针)的可扩展、高性能、公平的自旋锁,申请线程只在本地变量上自旋,由直接前驱负责通知其结束自旋(与CLH自旋锁不同的地方,不在轮询前驱的状态,而是由前驱主动通知),从而极大地减少了不必要的处理器缓存同步的次数,降低了总线和内存的开销。而MCS是在自己的结点的locked域上自旋等待。正因为如此,它解决了CLH在NUMA系统架构中获取locked域状态内存过远的问题。
public class MCSLock { public static class MCSNode { volatile MCSNode next; volatile boolean block = true; }
volatile MCSNode tail;
private static final AtomicReferenceFieldUpdater<MCSLock, MCSNode> UPDATER = AtomicReferenceFieldUpdater .newUpdater(MCSLock.class, MCSNode.class, "tail");
public void lock(MCSNode currentThreadMcsNode) { MCSNode predecessor = UPDATER.getAndSet(this, currentThreadMcsNode); if (predecessor != null) { predecessor.next = currentThreadMcsNode; while (currentThreadMcsNode.block) {
} } else { currentThreadMcsNode.block = false; } }
public void unlock(MCSNode currentThreadMcsNode) { if (currentThreadMcsNode.block) { return; } if (currentThreadMcsNode.next == null) { if (UPDATER.compareAndSet(this, currentThreadMcsNode, null)) { return; } else { while (currentThreadMcsNode.next == null) { } } } currentThreadMcsNode.next.block = false; currentThreadMcsNode.next = null; } }
|
总结
传统的Spin lock
和 Ticket Lock
都在同一个共享变量上竞争(例如SimpleSpinLock中的owner、Ticket Lock中的serviceNum),这样对给CPU保证缓存一致性带来的压力比较大,每次读写都需要同步到所有的线程,而MCS和CLH最大的优化点在于把上述同一个点上的竞争分散到队列的每个节点中去了。
参考
自旋锁、排队自旋锁、MCS锁、CLH锁