鍍金池/ 教程/ Java/ 基礎(chǔ)
final
volatile
重排序
總結(jié)
基礎(chǔ)
順序一致性

基礎(chǔ)

并發(fā)編程模型的分類

在并發(fā)編程中,我們需要處理兩個關(guān)鍵問題:線程之間如何通信及線程之間如何同步(這里的線程是指并發(fā)執(zhí)行的活動實體)。通信是指線程之間以何種機制來交換信息。在命令式編程中,線程之間的通信機制有兩種:共享內(nèi)存和消息傳遞。

在共享內(nèi)存的并發(fā)模型里,線程之間共享程序的公共狀態(tài),線程之間通過寫-讀內(nèi)存中的公共狀態(tài)來隱式進行通信。在消息傳遞的并發(fā)模型里,線程之間沒有公共狀態(tài),線程之間必須通過明確的發(fā)送消息來顯式進行通信。

同步是指程序用于控制不同線程之間操作發(fā)生相對順序的機制。在共享內(nèi)存并發(fā)模型里,同步是顯式進行的。程序員必須顯式指定某個方法或某段代碼需要在線程之間互斥執(zhí)行。在消息傳遞的并發(fā)模型里,由于消息的發(fā)送必須在消息的接收之前,因此同步是隱式進行的。

Java 的并發(fā)采用的是共享內(nèi)存模型,Java 線程之間的通信總是隱式進行,整個通信過程對程序員完全透明。如果編寫多線程程序的 Java 程序員不理解隱式進行的線程之間通信的工作機制,很可能會遇到各種奇怪的內(nèi)存可見性問題。

Java 內(nèi)存模型的抽象

在 java 中,所有實例域、靜態(tài)域和數(shù)組元素存儲在堆內(nèi)存中,堆內(nèi)存在線程之間共享(本文使用“共享變量”這個術(shù)語代指實例域,靜態(tài)域和數(shù)組元素)。局部變量(Local variables),方法定義參數(shù)(java 語言規(guī)范稱之為 formal method parameters)和異常處理器參數(shù)(exception handler parameters)不會在線程之間共享,它們不會有內(nèi)存可見性問題,也不受內(nèi)存模型的影響。

Java 線程之間的通信由 Java 內(nèi)存模型(本文簡稱為 JMM)控制,JMM 決定一個線程對共享變量的寫入何時對另一個線程可見。從抽象的角度來看,JMM 定義了線程和主內(nèi)存之間的抽象關(guān)系:線程之間的共享變量存儲在主內(nèi)存(main memory)中,每個線程都有一個私有的本地內(nèi)存(local memory),本地內(nèi)存中存儲了該線程以讀/寫共享變量的副本。本地內(nèi)存是 JMM 的一個抽象概念,并不真實存在。它涵蓋了緩存,寫緩沖區(qū),寄存器以及其他的硬件和編譯器優(yōu)化。Java 內(nèi)存模型的抽象示意圖如下:

http://wiki.jikexueyuan.com/project/java-memory-model/images/1.png" alt="" />

從上圖來看,線程A與線程B之間如要通信的話,必須要經(jīng)歷下面2個步驟:

  1. 首先,線程A把本地內(nèi)存A中更新過的共享變量刷新到主內(nèi)存中去。

  2. 然后,線程B到主內(nèi)存中去讀取線程A之前已更新過的共享變量。

下面通過示意圖來說明這兩個步驟:

http://wiki.jikexueyuan.com/project/java-memory-model/images/2.png" alt="" />

如上圖所示,本地內(nèi)存 A 和 B 有主內(nèi)存中共享變量 x 的副本。假設(shè)初始時,這三個內(nèi)存中的 x 值都為0。線程A在執(zhí)行時,把更新后的x值(假設(shè)值為1)臨時存放在自己的本地內(nèi)存 A 中。當(dāng)線程 A 和線程 B 需要通信時,線程 A 首先會把自己本地內(nèi)存中修改后的 x 值刷新到主內(nèi)存中,此時主內(nèi)存中的 x 值變?yōu)榱?。隨后,線程 B 到主內(nèi)存中去讀取線程 A 更新后的 x 值,此時線程 B 的本地內(nèi)存的 x 值也變?yōu)榱?。

從整體來看,這兩個步驟實質(zhì)上是線程 A 在向線程 B 發(fā)送消息,而且這個通信過程必須要經(jīng)過主內(nèi)存。JMM 通過控制主內(nèi)存與每個線程的本地內(nèi)存之間的交互,來為 java 程序員提供內(nèi)存可見性保證。

重排序

在執(zhí)行程序時為了提高性能,編譯器和處理器常常會對指令做重排序。重排序分三種類型:

  1. 編譯器優(yōu)化的重排序。編譯器在不改變單線程程序語義的前提下,可以重新安排語句的執(zhí)行順序。

  2. 指令級并行的重排序。現(xiàn)代處理器采用了指令級并行技術(shù)(Instruction-Level Parallelism, ILP)來將多條指令重疊執(zhí)行。如果不存在數(shù)據(jù)依賴性,處理器可以改變語句對應(yīng)機器指令的執(zhí)行順序。

  3. 內(nèi)存系統(tǒng)的重排序。由于處理器使用緩存和讀/寫緩沖區(qū),這使得加載和存儲操作看上去可能是在亂序執(zhí)行。

從 java 源代碼到最終實際執(zhí)行的指令序列,會分別經(jīng)歷下面三種重排序:

http://wiki.jikexueyuan.com/project/java-memory-model/images/3.png" alt="" />

上述的1屬于編譯器重排序,2和3屬于處理器重排序。這些重排序都可能會導(dǎo)致多線程程序出現(xiàn)內(nèi)存可見性問題。對于編譯器,JMM 的編譯器重排序規(guī)則會禁止特定類型的編譯器重排序(不是所有的編譯器重排序都要禁止)。對于處理器重排序,JMM 的處理器重排序規(guī)則會要求 java 編譯器在生成指令序列時,插入特定類型的內(nèi)存屏障(memory barriers,intel 稱之為 memory fence)指令,通過內(nèi)存屏障指令來禁止特定類型的處理器重排序(不是所有的處理器重排序都要禁止)。

JMM 屬于語言級的內(nèi)存模型,它確保在不同的編譯器和不同的處理器平臺之上,通過禁止特定類型的編譯器重排序和處理器重排序,為程序員提供一致的內(nèi)存可見性保證。

處理器重排序與內(nèi)存屏障指令

現(xiàn)代的處理器使用寫緩沖區(qū)來臨時保存向內(nèi)存寫入的數(shù)據(jù)。寫緩沖區(qū)可以保證指令流水線持續(xù)運行,它可以避免由于處理器停頓下來等待向內(nèi)存寫入數(shù)據(jù)而產(chǎn)生的延遲。同時,通過以批處理的方式刷新寫緩沖區(qū),以及合并寫緩沖區(qū)中對同一內(nèi)存地址的多次寫,可以減少對內(nèi)存總線的占用。雖然寫緩沖區(qū)有這么多好處,但每個處理器上的寫緩沖區(qū),僅僅對它所在的處理器可見。這個特性會對內(nèi)存操作的執(zhí)行順序產(chǎn)生重要的影響:處理器對內(nèi)存的讀/寫操作的執(zhí)行順序,不一定與內(nèi)存實際發(fā)生的讀/寫操作順序一致!為了具體說明,請看下面示例:

Processor A Processor B
a = 1; //A1
x = b; //A2
b = 2; //B1
y = a; //B2
初始狀態(tài):a = b = 0
處理器允許執(zhí)行后得到結(jié)果:x = y = 0

假設(shè)處理器 A 和處理器 B 按程序的順序并行執(zhí)行內(nèi)存訪問,最終卻可能得到 x = y = 0 的結(jié)果。具體的原因如下圖所示:

http://wiki.jikexueyuan.com/project/java-memory-model/images/4.png" alt="" />

這里處理器 A 和處理器 B 可以同時把共享變量寫入自己的寫緩沖區(qū)(A1,B1),然后從內(nèi)存中讀取另一個共享變量(A2,B2),最后才把自己寫緩存區(qū)中保存的臟數(shù)據(jù)刷新到內(nèi)存中(A3,B3)。當(dāng)以這種時序執(zhí)行時,程序就可以得到 x = y = 0 的結(jié)果。

從內(nèi)存操作實際發(fā)生的順序來看,直到處理器 A 執(zhí)行 A3 來刷新自己的寫緩存區(qū),寫操作 A1 才算真正執(zhí)行了。雖然處理器 A 執(zhí)行內(nèi)存操作的順序為:A1->A2,但內(nèi)存操作實際發(fā)生的順序卻是:A2->A1。此時,處理器 A 的內(nèi)存操作順序被重排序了(處理器 B 的情況和處理器 A 一樣,這里就不贅述了)。

這里的關(guān)鍵是,由于寫緩沖區(qū)僅對自己的處理器可見,它會導(dǎo)致處理器執(zhí)行內(nèi)存操作的順序可能會與內(nèi)存實際的操作執(zhí)行順序不一致。由于現(xiàn)代的處理器都會使用寫緩沖區(qū),因此現(xiàn)代的處理器都會允許對寫-讀操作重排序。

下面是常見處理器允許的重排序類型的列表:

Load-Load Load-Store Store-Store Store-Load 數(shù)據(jù)依賴
sparc-TSO N N N Y N
x86 N N N Y N
ia64 Y Y Y Y N
PowerPC Y Y Y Y N

上表單元格中的 “N” 表示處理器不允許兩個操作重排序,“Y” 表示允許重排序。

從上表我們可以看出:常見的處理器都允許 Store-Load 重排序;常見的處理器都不允許對存在數(shù)據(jù)依賴的操作做重排序。sparc-TSO 和 x86 擁有相對較強的處理器內(nèi)存模型,它們僅允許對寫-讀操作做重排序(因為它們都使用了寫緩沖區(qū))。

※注1:sparc-TSO 是指以 TSO(Total Store Order)內(nèi)存模型運行時,sparc 處理器的特性。

※注2:上表中的 x86 包括 x64 及 AMD64。

※注3:由于 ARM 處理器的內(nèi)存模型與 PowerPC 處理器的內(nèi)存模型非常類似,本文將忽略它。

※注4:數(shù)據(jù)依賴性后文會專門說明。

為了保證內(nèi)存可見性,java 編譯器在生成指令序列的適當(dāng)位置會插入內(nèi)存屏障指令來禁止特定類型的處理器重排序。JMM 把內(nèi)存屏障指令分為下列四類:

屏障類型 指令示例 說明
LoadLoad Barriers Load1; LoadLoad; Load2 確保Load1數(shù)據(jù)的裝載,之前于Load2及所有后續(xù)裝載指令的裝載。
StoreStore Barriers Store1; StoreStore; Store2 確保Store1數(shù)據(jù)對其他處理器可見(刷新到內(nèi)存),之前于Store2及所有后續(xù)存儲指令的存儲。
LoadStore Barriers Load1; LoadStore; Store2 確保Load1數(shù)據(jù)裝載,之前于Store2及所有后續(xù)的存儲指令刷新到內(nèi)存。
StoreLoad Barriers Store1; StoreLoad; Load2 確保Store1數(shù)據(jù)對其他處理器變得可見(指刷新到內(nèi)存),之前于Load2及所有后續(xù)裝載指令的裝載。StoreLoad Barriers會使該屏障之前的所有內(nèi)存訪問指令(存儲和裝載指令)完成之后,才執(zhí)行該屏障之后的內(nèi)存訪問指令。

StoreLoad Barriers 是一個“全能型”的屏障,它同時具有其他三個屏障的效果?,F(xiàn)代的多處理器大都支持該屏障(其他類型的屏障不一定被所有處理器支持)。執(zhí)行該屏障開銷會很昂貴,因為當(dāng)前處理器通常要把寫緩沖區(qū)中的數(shù)據(jù)全部刷新到內(nèi)存中(buffer fully flush)。

happens-before

從 JDK5 開始,java 使用新的 JSR -133 內(nèi)存模型(本文除非特別說明,針對的都是 JSR- 133 內(nèi)存模型)。JSR-133 使用 happens-before 的概念來闡述操作之間的內(nèi)存可見性。在 JMM 中,如果一個操作執(zhí)行的結(jié)果需要對另一個操作可見,那么這兩個操作之間必須要存在happens-before 關(guān)系。這里提到的兩個操作既可以是在一個線程之內(nèi),也可以是在不同線程之間。

與程序員密切相關(guān)的 happens-before 規(guī)則如下:

  • 程序順序規(guī)則:一個線程中的每個操作,happens- before 于該線程中的任意后續(xù)操作。
  • 監(jiān)視器鎖規(guī)則:對一個監(jiān)視器鎖的解鎖,happens- before 于隨后對這個監(jiān)視器鎖的加鎖。
  • volatile 變量規(guī)則:對一個 volatile 域的寫,happens- before 于任意后續(xù)對這個 volatile 域的讀。
  • 傳遞性:如果 A happens- before B,且 B happens- before C,那么 A happens- before C。

注意,兩個操作之間具有 happens-before 關(guān)系,并不意味著前一個操作必須要在后一個操作之前執(zhí)行!happens-before 僅僅要求前一個操作(執(zhí)行的結(jié)果)對后一個操作可見,且前一個操作按順序排在第二個操作之前(the first is visible to and ordered before the second)。happens- before 的定義很微妙,后文會具體說明 happens-before 為什么要這么定義。

happens-before與JMM的關(guān)系如下圖所示:

http://wiki.jikexueyuan.com/project/java-memory-model/images/5.png" alt="" />

如上圖所示,一個 happens-before 規(guī)則通常對應(yīng)于多個編譯器和處理器重排序規(guī)則。對于 java 程序員來說,happens-before 規(guī)則簡單易懂,它避免 java 程序員為了理解 JMM 提供的內(nèi)存可見性保證而去學(xué)習(xí)復(fù)雜的重排序規(guī)則以及這些規(guī)則的具體實現(xiàn)。

上一篇:重排序下一篇:順序一致性