鍍金池/ 教程/ Java/
final
volatile
重排序
總結(jié)
基礎(chǔ)
順序一致性

鎖的釋放-獲取建立的 happens before 關(guān)系

鎖是 java 并發(fā)編程中最重要的同步機(jī)制。鎖除了讓臨界區(qū)互斥執(zhí)行外,還可以讓釋放鎖的線程向獲取同一個(gè)鎖的線程發(fā)送消息。下面是鎖釋放-獲取的示例代碼:

class MonitorExample {
    int a = 0;

    public synchronized void writer() {  //1
        a++;                             //2
    }                                    //3

    public synchronized void reader() {  //4
        int i = a;                       //5
        ……
    }                                    //6
}  

假設(shè)線程 A 執(zhí)行 writer() 方法,隨后線程 B 執(zhí)行 reader() 方法。根據(jù) happens before 規(guī)則,這個(gè)過(guò)程包含的 happens before 關(guān)系可以分為兩類:

  1. 根據(jù)程序次序規(guī)則,1 happens before 2, 2 happens before 3; 4 happens before 5, 5 happens before 6。
  2. 根據(jù)監(jiān)視器鎖規(guī)則,3 happens before 4。
  3. 根據(jù) happens before 的傳遞性,2 happens before 5。

上述 happens before 關(guān)系的圖形化表現(xiàn)形式如下:

http://wiki.jikexueyuan.com/project/java-memory-model/images/24.png" alt="" />

在上圖中,每一個(gè)箭頭鏈接的兩個(gè)節(jié)點(diǎn),代表了一個(gè) happens before 關(guān)系。黑色箭頭表示程序順序規(guī)則;橙色箭頭表示監(jiān)視器鎖規(guī)則;藍(lán)色箭頭表示組合這些規(guī)則后提供的 happens before保證。

上圖表示在線程A釋放了鎖之后,隨后線程B獲取同一個(gè)鎖。在上圖中,2 happens before 5。因此,線程A在釋放鎖之前所有可見的共享變量,在線程B獲取同一個(gè)鎖之后,將立刻變得對(duì)B線程可見。

鎖釋放和獲取的內(nèi)存語(yǔ)義

當(dāng)線程釋放鎖時(shí),JMM 會(huì)把該線程對(duì)應(yīng)的本地內(nèi)存中的共享變量刷新到主內(nèi)存中。以上面的MonitorExample 程序?yàn)槔珹線程釋放鎖后,共享數(shù)據(jù)的狀態(tài)示意圖如下:

http://wiki.jikexueyuan.com/project/java-memory-model/images/25.png" alt="" />

當(dāng)線程獲取鎖時(shí),JMM 會(huì)把該線程對(duì)應(yīng)的本地內(nèi)存置為無(wú)效。從而使得被監(jiān)視器保護(hù)的臨界區(qū)代碼必須要從主內(nèi)存中去讀取共享變量。下面是鎖獲取的狀態(tài)示意圖:

http://wiki.jikexueyuan.com/project/java-memory-model/images/26.png" alt="" />

對(duì)比鎖釋放-獲取的內(nèi)存語(yǔ)義與 volatile 寫-讀的內(nèi)存語(yǔ)義,可以看出:鎖釋放與 volatile 寫有相同的內(nèi)存語(yǔ)義;鎖獲取與 volatile 讀有相同的內(nèi)存語(yǔ)義。

下面對(duì)鎖釋放和鎖獲取的內(nèi)存語(yǔ)義做個(gè)總結(jié):

  • 線程 A 釋放一個(gè)鎖,實(shí)質(zhì)上是線程 A 向接下來(lái)將要獲取這個(gè)鎖的某個(gè)線程發(fā)出了(線程 A 對(duì)共享變量所做修改的)消息。
  • 線程 B 獲取一個(gè)鎖,實(shí)質(zhì)上是線程 B 接收了之前某個(gè)線程發(fā)出的(在釋放這個(gè)鎖之前對(duì)共享變量所做修改的)消息。
  • 線程 A 釋放鎖,隨后線程 B 獲取這個(gè)鎖,這個(gè)過(guò)程實(shí)質(zhì)上是線程 A 通過(guò)主內(nèi)存向線程 B 發(fā)送消息。

鎖內(nèi)存語(yǔ)義的實(shí)現(xiàn)

本文將借助 ReentrantLock 的源代碼,來(lái)分析鎖內(nèi)存語(yǔ)義的具體實(shí)現(xiàn)機(jī)制。

請(qǐng)看下面的示例代碼:

class ReentrantLockExample {
int a = 0;
ReentrantLock lock = new ReentrantLock();

public void writer() {
    lock.lock();         //獲取鎖
    try {
        a++;
    } finally {
        lock.unlock();  //釋放鎖
    }
}

public void reader () {
    lock.lock();        //獲取鎖
    try {
        int i = a;
        ……
    } finally {
        lock.unlock();  //釋放鎖
    }
}
}  

在 ReentrantLock 中,調(diào)用 lock() 方法獲取鎖;調(diào)用 unlock() 方法釋放鎖。

ReentrantLock 的實(shí)現(xiàn)依賴于 java 同步器框架 AbstractQueuedSynchronizer(本文簡(jiǎn)稱之為AQS)。AQS 使用一個(gè)整型的 volatile 變量(命名為 state)來(lái)維護(hù)同步狀態(tài),馬上我們會(huì)看到,這個(gè) volatile 變量是 ReentrantLock 內(nèi)存語(yǔ)義實(shí)現(xiàn)的關(guān)鍵。 下面是ReentrantLock 的類圖(僅畫出與本文相關(guān)的部分):

http://wiki.jikexueyuan.com/project/java-memory-model/images/27.png" alt="" />

ReentrantLock 分為公平鎖和非公平鎖,我們首先分析公平鎖。

使用公平鎖時(shí),加鎖方法 lock() 的方法調(diào)用軌跡如下:

  1. ReentrantLock : lock()
  2. FairSync : lock()
  3. AbstractQueuedSynchronizer : acquire(int arg)
  4. ReentrantLock : tryAcquire(int acquires)

在第4步真正開始加鎖,下面是該方法的源代碼:

protected final boolean tryAcquire(int acquires) {
    final Thread current = Thread.currentThread();
    int c = getState();   //獲取鎖的開始,首先讀volatile變量state
    if (c == 0) {
        if (isFirst(current) &&
            compareAndSetState(0, acquires)) {
            setExclusiveOwnerThread(current);
            return true;
        }
    }
    else if (current == getExclusiveOwnerThread()) {
        int nextc = c + acquires;
        if (nextc < 0)  
            throw new Error("Maximum lock count exceeded");
        setState(nextc);
        return true;
    }
    return false;
}  

從上面源代碼中我們可以看出,加鎖方法首先讀 volatile 變量 state。

在使用公平鎖時(shí),解鎖方法 unlock() 的方法調(diào)用軌跡如下:

  1. ReentrantLock : unlock()
  2. AbstractQueuedSynchronizer : release(int arg)
  3. Sync : tryRelease(int releases)

在第3步真正開始釋放鎖,下面是該方法的源代碼:

protected final boolean tryRelease(int releases) {
    int c = getState() - releases;
    if (Thread.currentThread() != getExclusiveOwnerThread())
        throw new IllegalMonitorStateException();
    boolean free = false;
    if (c == 0) {
        free = true;
        setExclusiveOwnerThread(null);
    }
    setState(c);           //釋放鎖的最后,寫volatile變量state
    return free;
}  

從上面的源代碼我們可以看出,在釋放鎖的最后寫 volatile 變量 state。

公平鎖在釋放鎖的最后寫 volatile 變量 state;在獲取鎖時(shí)首先讀這個(gè) volatile 變量。根據(jù) volatile 的 happens-before 規(guī)則,釋放鎖的線程在寫 volatile 變量之前可見的共享變量,在獲取鎖的線程讀取同一個(gè) volatile 變量后將立即變的對(duì)獲取鎖的線程可見。

現(xiàn)在我們分析非公平鎖的內(nèi)存語(yǔ)義的實(shí)現(xiàn)。

非公平鎖的釋放和公平鎖完全一樣,所以這里僅僅分析非公平鎖的獲取。

使用非公平鎖時(shí),加鎖方法 lock() 的方法調(diào)用軌跡如下:

  1. ReentrantLock : lock()
  2. NonfairSync : lock()
  3. AbstractQueuedSynchronizer : compareAndSetState(int expect, int update)

在第3步真正開始加鎖,下面是該方法的源代碼:

protected final boolean compareAndSetState(int expect, int update) {
    return unsafe.compareAndSwapInt(this, stateOffset, expect, update);
}  

該方法以原子操作的方式更新 state 變量,本文把 java 的 compareAndSet() 方法調(diào)用簡(jiǎn)稱為 CAS。JDK 文檔對(duì)該方法的說(shuō)明如下:如果當(dāng)前狀態(tài)值等于預(yù)期值,則以原子方式將同步狀態(tài)設(shè)置為給定的更新值。此操作具有 volatile 讀和寫的內(nèi)存語(yǔ)義。

這里我們分別從編譯器和處理器的角度來(lái)分析,CAS 如何同時(shí)具有 volatile 讀和 volatile 寫的內(nèi)存語(yǔ)義。

前文我們提到過(guò),編譯器不會(huì)對(duì) volatile 讀與 volatile 讀后面的任意內(nèi)存操作重排序;編譯器不會(huì)對(duì) volatile 寫與 volatile 寫前面的任意內(nèi)存操作重排序。組合這兩個(gè)條件,意味著為了同時(shí)實(shí)現(xiàn) volatile 讀和 volatile 寫的內(nèi)存語(yǔ)義,編譯器不能對(duì) CAS 與 CAS 前面和后面的任意內(nèi)存操作重排序。

下面我們來(lái)分析在常見的 intel x86 處理器中,CAS 是如何同時(shí)具有 volatile 讀和 volatile 寫的內(nèi)存語(yǔ)義的。

下面是 sun.misc.Unsafe 類的 compareAndSwapInt() 方法的源代碼:

public final native boolean compareAndSwapInt(Object o, long offset,
                                              int expected,
                                              int x);  

可以看到這是個(gè)本地方法調(diào)用。這個(gè)本地方法在 openjdk 中依次調(diào)用的 C++ 代碼為:unsafe.cpp,atomic.cpp 和 atomicwindowsx86.inline.hpp。這個(gè)本地方法的最終實(shí)現(xiàn)在 openjdk 的如下位置:openjdk-7-fcs-src-b147-27jun2011\openjdk\hotspot\src\oscpu\windowsx86\vm\ atomicwindowsx86.inline.hpp(對(duì)應(yīng)于 windows 操作系統(tǒng),X86 處理器)。下面是對(duì)應(yīng)于 intel x86 處理器的源代碼的片段:

// Adding a lock prefix to an instruction on MP machine
// VC++ doesn't like the lock prefix to be on a single line
// so we can't insert a label after the lock prefix.
// By emitting a lock prefix, we can define a label after it.
#define LOCK_IF_MP(mp) __asm cmp mp, 0  \
                       __asm je L0      \
                       __asm _emit 0xF0 \
                       __asm L0:

inline jint     Atomic::cmpxchg    (jint     exchange_value, volatile jint*     dest, jint     compare_value) {
  // alternative for InterlockedCompareExchange
  int mp = os::is_MP();
  __asm {
    mov edx, dest
    mov ecx, exchange_value
    mov eax, compare_value
    LOCK_IF_MP(mp)
    cmpxchg dword ptr [edx], ecx
  }
}  

如上面源代碼所示,程序會(huì)根據(jù)當(dāng)前處理器的類型來(lái)決定是否為 cmpxchg 指令添加 lock 前綴。如果程序是在多處理器上運(yùn)行,就為 cmpxchg 指令加上 lock 前綴(lock cmpxchg)。反之,如果程序是在單處理器上運(yùn)行,就省略 lock 前綴(單處理器自身會(huì)維護(hù)單處理器內(nèi)的順序一致性,不需要 lock 前綴提供的內(nèi)存屏障效果)。

intel 的手冊(cè)對(duì) lock 前綴的說(shuō)明如下:

  1. 確保對(duì)內(nèi)存的讀-改-寫操作原子執(zhí)行。在 Pentium 及 Pentium 之前的處理器中,帶有l(wèi)ock 前綴的指令在執(zhí)行期間會(huì)鎖住總線,使得其他處理器暫時(shí)無(wú)法通過(guò)總線訪問(wèn)內(nèi)存。很顯然,這會(huì)帶來(lái)昂貴的開銷。從 Pentium 4,Intel Xeon 及 P6 處理器開始,intel 在原有總線鎖的基礎(chǔ)上做了一個(gè)很有意義的優(yōu)化:如果要訪問(wèn)的內(nèi)存區(qū)域(area of memory)在 lock 前綴指令執(zhí)行期間已經(jīng)在處理器內(nèi)部的緩存中被鎖定(即包含該內(nèi)存區(qū)域的緩存行當(dāng)前處于獨(dú)占或以修改狀態(tài)),并且該內(nèi)存區(qū)域被完全包含在單個(gè)緩存行(cache line)中,那么處理器將直接執(zhí)行該指令。由于在指令執(zhí)行期間該緩存行會(huì)一直被鎖定,其它處理器無(wú)法讀/寫該指令要訪問(wèn)的內(nèi)存區(qū)域,因此能保證指令執(zhí)行的原子性。這個(gè)操作過(guò)程叫做緩存鎖定(cache locking),緩存鎖定將大大降低 lock 前綴指令的執(zhí)行開銷,但是當(dāng)多處理器之間的競(jìng)爭(zhēng)程度很高或者指令訪問(wèn)的內(nèi)存地址未對(duì)齊時(shí),仍然會(huì)鎖住總線。

  2. 禁止該指令與之前和之后的讀和寫指令重排序。

  3. 把寫緩沖區(qū)中的所有數(shù)據(jù)刷新到內(nèi)存中。

上面的第2點(diǎn)和第3點(diǎn)所具有的內(nèi)存屏障效果,足以同時(shí)實(shí)現(xiàn) volatile 讀和 volatile 寫的內(nèi)存語(yǔ)義。

經(jīng)過(guò)上面的這些分析,現(xiàn)在我們終于能明白為什么 JDK 文檔說(shuō) CAS 同時(shí)具有 volatile 讀和volatile 寫的內(nèi)存語(yǔ)義了。

現(xiàn)在對(duì)公平鎖和非公平鎖的內(nèi)存語(yǔ)義做個(gè)總結(jié):

  • 公平鎖和非公平鎖釋放時(shí),最后都要寫一個(gè) volatile 變量 state。
  • 公平鎖獲取時(shí),首先會(huì)去讀這個(gè) volatile 變量。
  • 非公平鎖獲取時(shí),首先會(huì)用 CAS 更新這個(gè) volatile 變量,這個(gè)操作同時(shí)具有 volatile 讀和 volatile 寫的內(nèi)存語(yǔ)義。

從本文對(duì) ReentrantLock 的分析可以看出,鎖釋放-獲取的內(nèi)存語(yǔ)義的實(shí)現(xiàn)至少有下面兩種方式:

  1. 利用 volatile 變量的寫-讀所具有的內(nèi)存語(yǔ)義。
  2. 利用 CAS 所附帶的 volatile 讀和 volatile 寫的內(nèi)存語(yǔ)義。

concurrent 包的實(shí)現(xiàn)

由于 java 的 CAS 同時(shí)具有 volatile 讀和 volatile 寫的內(nèi)存語(yǔ)義,因此 Java 線程之間的通信現(xiàn)在有了下面四種方式:

  1. A 線程寫 volatile 變量,隨后 B 線程讀這個(gè) volatile 變量。
  2. A 線程寫 volatile 變量,隨后 B 線程用 CAS 更新這個(gè) volatile 變量。
  3. A 線程用 CAS 更新一個(gè)volatile變量,隨后 B 線程用 CAS 更新這個(gè) volatile 變量。
  4. A 線程用 CAS 更新一個(gè) volatile 變量,隨后 B 線程讀這個(gè) volatile 變量。

Java 的 CAS 會(huì)使用現(xiàn)代處理器上提供的高效機(jī)器級(jí)別原子指令,這些原子指令以原子方式對(duì)內(nèi)存執(zhí)行讀-改-寫操作,這是在多處理器中實(shí)現(xiàn)同步的關(guān)鍵(從本質(zhì)上來(lái)說(shuō),能夠支持原子性讀-改-寫指令的計(jì)算機(jī)器,是順序計(jì)算圖靈機(jī)的異步等價(jià)機(jī)器,因此任何現(xiàn)代的多處理器都會(huì)去支持某種能對(duì)內(nèi)存執(zhí)行原子性讀-改-寫操作的原子指令)。同時(shí),volatile 變量的讀/寫和 CAS 可以實(shí)現(xiàn)線程之間的通信。把這些特性整合在一起,就形成了整個(gè) concurrent 包得以實(shí)現(xiàn)的基石。如果我們仔細(xì)分析 concurrent 包的源代碼實(shí)現(xiàn),會(huì)發(fā)現(xiàn)一個(gè)通用化的實(shí)現(xiàn)模式:

  1. 首先,聲明共享變量為 volatile;
  2. 然后,使用 CAS 的原子條件更新來(lái)實(shí)現(xiàn)線程之間的同步;
  3. 同時(shí),配合以 volatile 的讀/寫和 CAS 所具有的 volatile 讀和寫的內(nèi)存語(yǔ)義來(lái)實(shí)現(xiàn)線程之間的通信。

AQS,非阻塞數(shù)據(jù)結(jié)構(gòu)和原子變量類(java.util.concurrent.atomic 包中的類),這些 concurrent 包中的基礎(chǔ)類都是使用這種模式來(lái)實(shí)現(xiàn)的,而 concurrent 包中的高層類又是依賴于這些基礎(chǔ)類來(lái)實(shí)現(xiàn)的。從整體來(lái)看,concurrent 包的實(shí)現(xiàn)示意圖如下:

http://wiki.jikexueyuan.com/project/java-memory-model/images/28.png" alt="" />

上一篇:final