Golang的Channel是其CSP並發模式的關鍵組成部分,也是Goroutine之間通訊的橋樑。 Channel在Golang中被頻繁使用,深入了解其內部實現原理至關重要。本文將基於Go 1.13源碼分析Channel的底層實作。
在正式分析Channel實作之前,先回顧其基本用法:
<code class="language-go">package main import "fmt" func main() { c := make(chan int) go func() { c <- 1 // 发送操作 }() x := <-c // 接收操作 fmt.Println(x) }</code>
這段程式碼展示了Channel的兩個基本操作:
c <- 1
x := <-c
Channel分為緩衝Channel和非緩衝Channel。上述程式碼使用了非緩衝Channel。在非緩衝Channel中,如果目前沒有其他Goroutine接收數據,則發送方會在傳送語句處阻塞。
初始化Channel時可以指定緩衝區大小,例如make(chan int, 2)
指定緩衝區大小為2。在緩衝區未滿之前,發送方可以無阻塞地發送數據,無需等待接收方準備好。但如果緩衝區已滿,發送方仍然會阻塞。
在深入Channel原始碼之前,需要先找到Golang中Channel的具體實作位置。使用Channel時,實際上呼叫的是runtime.makechan
、runtime.chansend
和runtime.chanrecv
等底層函數。
可以使用go tool compile -N -l -S hello.go
指令將程式碼轉換為組譯指令,或使用線上工具Compiler Explorer (例如:go.godbolt.org/z/3xw5Cj)。透過分析彙編指令,可以發現:
make(chan int)
對應runtime.makechan
函數。 c <- 1
對應runtime.chansend
函數。 x := <-c
對應runtime.chanrecv
函數。 這些函數的實作都位於Go原始碼的runtime/chan.go
檔案中。
make(chan int)
會被編譯器轉換為runtime.makechan
函數,其函數簽章如下:
<code class="language-go">func makechan(t *chantype, size int) *hchan</code>
其中,t *chantype
是Channel元素類型,size int
是使用者指定的緩衝區大小(未指定則為0),傳回值為*hchan
。 hchan
是Golang中Channel的內部實作結構體,定義如下:
<code class="language-go">type hchan struct { qcount uint // 缓冲区中已放入元素的数量 dataqsiz uint // 用户构造Channel时指定的缓冲区大小 buf unsafe.Pointer // 缓冲区 elemsize uint16 // 缓冲区中每个元素的大小 closed uint32 // Channel是否关闭,==0表示未关闭 elemtype *_type // Channel元素的类型信息 sendx uint // 缓冲区中发送元素的索引位置(发送索引) recvx uint // 缓冲区中接收元素的索引位置(接收索引) recvq waitq // 等待接收的Goroutine列表 sendq waitq // 等待发送的Goroutine列表 lock mutex }</code>
hchan
中的屬性大致分為三類:
buf
, dataqsiz
, qcount
等。當Channel的緩衝區大小不為0時,緩衝區用於儲存待接收的數據,使用環形緩衝區實作。 recvq
包含等待接收資料的Goroutine,sendq
包含等待傳送資料的Goroutine。 waitq
使用雙向鍊錶實作。 lock
, elemtype
, closed
等。 makechan
函數主要進行一些合法性檢查和緩衝區、hchan
等屬性的記憶體分配,這裡不再深入討論。
基於hchan
屬性的簡單分析,可以看出其中有兩個重要的組成部分:緩衝區和等待隊列。 hchan
的所有行為和實現都圍繞著這兩個組成部分。
Channel的傳送和接收過程非常相似。先分析Channel的發送過程(例如c <- 1
)。
嘗試傳送資料至Channel時,如果recvq
佇列不為空,則會先從recvq
頭部取出一個等待接收資料的Goroutine,並將資料直接傳送給該Goroutine。程式碼如下:
<code class="language-go">package main import "fmt" func main() { c := make(chan int) go func() { c <- 1 // 发送操作 }() x := <-c // 接收操作 fmt.Println(x) }</code>
recvq
包含等待接收資料的Goroutine。當一個Goroutine使用接收操作(例如x := <-c
)時,如果此時sendq
不為空,則會從sendq
中取出一個Goroutine,並將資料傳送給它。
如果recvq
為空,表示此時沒有Goroutine等待接收數據,Channel會嘗試將數據放入緩衝區:
<code class="language-go">func makechan(t *chantype, size int) *hchan</code>
這段程式碼的功能很簡單,就是將資料放入緩衝區。這個過程涉及環形緩衝區的操作,dataqsiz
表示使用者指定的緩衝區大小(未指定則預設為0)。
如果使用的是非緩衝Channel或緩衝區已滿(c.qcount == c.dataqsiz
),則會將待發送的資料和目前Goroutine打包成sudog
對象,放入sendq
,並將目前Goroutine設定為等待狀態:
<code class="language-go">type hchan struct { qcount uint // 缓冲区中已放入元素的数量 dataqsiz uint // 用户构造Channel时指定的缓冲区大小 buf unsafe.Pointer // 缓冲区 elemsize uint16 // 缓冲区中每个元素的大小 closed uint32 // Channel是否关闭,==0表示未关闭 elemtype *_type // Channel元素的类型信息 sendx uint // 缓冲区中发送元素的索引位置(发送索引) recvx uint // 缓冲区中接收元素的索引位置(接收索引) recvq waitq // 等待接收的Goroutine列表 sendq waitq // 等待发送的Goroutine列表 lock mutex }</code>
goparkunlock
會解鎖輸入的互斥鎖並掛起當前Goroutine,將其設定為等待狀態。 gopark
和goready
是成對出現的,是互逆的操作。
從使用者角度來看,呼叫gopark
後,傳送資料的程式碼語句會阻塞。
Channel的接收過程與發送過程基本上類似,這裡不再贅述。接收過程中涉及的緩衝區相關操作會在後面詳細描述。
要注意的是,Channel的整個傳送和接收過程都使用了runtime.mutex
進行加鎖。 runtime.mutex
是runtime相關原始碼中常用的輕量級鎖,整個過程並非最高效的無鎖方案。 Golang中存在一個關於無鎖Channel的issue:go/issues#8899。
Channel使用環形緩衝區快取寫入的資料。環形緩衝區具有諸多優點,非常適合實現固定長度的FIFO佇列。
Channel中環形緩衝區的實作如下:
hchan
中與緩衝區相關的兩個變數:recvx
和sendx
。 sendx
表示緩衝區中可寫入的索引,recvx
表示緩衝區中可讀的索引。 recvx
和sendx
之間的元素表示已正常放入緩衝區的資料。
可以直接使用buf[recvx]
讀取佇列的第一個元素,使用buf[sendx] = x
將元素放入佇列的末端。
當緩衝區未滿時,將資料放入緩衝區的操作如下:
<code class="language-go">package main import "fmt" func main() { c := make(chan int) go func() { c <- 1 // 发送操作 }() x := <-c // 接收操作 fmt.Println(x) }</code>
chanbuf(c, c.sendx)
等價於c.buf[c.sendx]
。上述過程很簡單,就是將資料複製到緩衝區sendx
位置。
然後,將sendx
移到下一個位置。如果sendx
到達最後一個位置,則將其設為0,這是典型的首尾相連的方法。
當緩衝區未滿時,sendq
也必須為空(因為如果緩衝區未滿,發送資料的Goroutine不會排隊,而是直接將資料放入緩衝區)。此時Channel的讀取邏輯chanrecv
比較簡單,可以直接從緩衝區讀取數據,也是一個移動recvx
的過程,與上面的緩衝區寫入基本上相同。
當sendq
中有等待的Goroutine時,緩衝區此時一定已滿。此時Channel的讀取邏輯如下:
<code class="language-go">func makechan(t *chantype, size int) *hchan</code>
ep
是接收資料的變數對應的位址(例如,在x := <-c
中,ep
就是x
的位址)。 sg
表示從sendq
取出的第一個sudog
。程式碼中:
typedmemmove(c.elemtype, ep, qp)
表示將緩衝區中目前可讀的元素複製到接收變數的位址。 typedmemmove(c.elemtype, qp, sg.elem)
表示將sendq
中Goroutine等待發送的資料複製到緩衝區。因為後面執行了recv
,所以相當於將sendq
中的資料放在佇列的末端。 簡單來說,這裡Channel將緩衝區中的第一個資料複製到對應的接收變量,同時將sendq
中的元素複製到佇列的末尾,從而實現FIFO(先進先出)。
Channel作為Golang中最常用的設施之一,理解其原始碼有助於更好地使用和理解Channel。同時,也不要過度迷信和依賴Channel的效能,目前Channel的設計仍有很大的優化空間。
最佳化建議:
最後,推薦一個非常適合部署Go服務的平台:Leapcell
更多資訊請查看文件!
Leapcell Twitter: https://www.php.cn/link/7884effb9452a6d7a7a79499ef854afd
以上是Go 頻道解鎖:它們是如何運作的的詳細內容。更多資訊請關注PHP中文網其他相關文章!