在並發程序中,程式設計師會特別關注不同進程或執行緒之間的資料同步,特別是多個執行緒同時修改同一變數時,必須採取可靠的同步或其它措施保障資料被正確地修改,這裡的一條重要原則是:不要假設指令執行的順序,你無法預知不同執行緒之間的指令會以何種順序執行。
但是在單執行緒程式中,通常我們容易假設指令是順序執行的,否則可以想像程式會發生什麼可怕的變化。理想的模型是:各種指令執行的順序是唯一且有序的,這個順序就是它們被編寫在程式碼中的順序,與處理器或其它因素無關,這種模型被稱作順序一致性模型,也是基於馮諾依曼體系的模型。當然,這種假設本身是合理的,在實務上也鮮有異常發生,但事實上,沒有哪個現代多處理器架構會採用這種模型,因為它是在太低效了。而在編譯最佳化和CPU管線中,幾乎都牽涉到指令重新排序。
編譯期重排序
編譯期重排序的典型就是透過調整指令順序,在不改變程式語意的前提下,盡可能減少暫存器的讀取、儲存次數,充分重複使用暫存器的儲存值。
假設第一條指令計算一個值賦給變數A並存放在暫存器中,第二條指令與A無關但需要佔用暫存器(假設它將佔用A所在的那個暫存器),第三條指令使用A的值且與第二條指令無關。那麼如果依照順序一致性模型,A在第一條指令執行過後被放入暫存器,在第二條指令執行時A不再存在,第三條指令執行時A重新被讀入暫存器,而這個過程中,A的值沒有改變。通常編譯器都會交換第二和第三條指令的位置,這樣第一條指令結束時A存在於暫存器中,接下來可以直接從暫存器讀取A的值,降低了重複讀取的開銷。
重排序對於管線的意義
現代CPU幾乎都採用管線機制加快指令的處理速度,一般來說,一條指令需要若干個CPU時脈週期處理,而透過管線並行執行,可以在同等的時脈週期內執行若干條指令,具體做法簡單地說就是把指令分為不同的執行週期,例如讀取、尋址、解析、執行等步驟,並放在不同的元件中處理,同時在執行單元EU中,功能單元被分成不同的元件,例如加法元件、乘法元件、載入元件、儲存元件等,可以進一步實現不同的運算並行執行。
管線架構決定了指令應該被並行執行,而不是在順序化模型中所認為的。重排序有利於充分使用管線,進而達到超標量的效果。
確保順序性
儘管指令在執行時並不一定按照我們所編寫的順序執行,但毋庸置疑的是,在單線程環境下,指令執行的最終效果應與其在順序執行下的效果一致,否則這種優化便會失去意義。
通常無論是在編譯期還是運行期進行的指令重排序,都會滿足上面的原則。
Java儲存模型中的重排序
在Java儲存模型(Java Memory Model, JMM)中,重排序是十分重要的一節,特別是在並發程式設計中。 JMM透過happens-before法則保證順序執行語意,如果想要讓執行操作B的執行緒觀察到執行操作A的執行緒的結果,那麼A和B就必須滿足happens-before原則,否則,JVM可以對它們進行任意排序以提高程式效能。
volatile關鍵字可以保證變數的可見性,因為對volatile的操作都在Main Memory中,而Main Memory是被所有執行緒所共享的,這裡的代價就是犧牲了效能,無法利用暫存器或Cache,因為它們都不是全局的,無法保證可見性,可能產生髒讀。
volatile還有一個作用就是局部阻止重排序的發生,對volatile變數的操作指令都不會被重新排序,因為如果重排序,又可能產生可見性問題。
在保證可見性方面,鎖(包括明確鎖定、物件鎖定)以及對原子變數的讀寫都可以確保變數的可見性。但是實現方式略有不同,例如同步鎖定保證得到鎖定時從記憶體重新讀入資料刷新緩存,釋放鎖定時將資料寫回記憶體以保資料可見,而volatile變數乾脆都是讀寫記憶體。
更多JAVA中JVM的重排序詳細介紹相關文章請關注PHP中文網!