一文搞懂 Gunicorn 與 Python GIL
什麼是 Python GIL,它是如何運作的,以及它如何影響 gunicorn。
生產環境我該選擇哪一種 Gunicorn worker類型?
Python 有一個全域鎖定 (GIL),它只允許一個執行緒運行(即解釋字節碼)。在我看來,如果你想優化你的 Python 服務,理解 Python 如何處理並發是必不可少的。
Python 和 gunicorn 為您提供了處理並發的不同方法,並且由於沒有涵蓋所有用例的靈丹妙藥,因此最好了解每個選項的選項、權衡和優勢。
Gunicorn worker類型
Gunicorn 以「workers types」的概念公開了這些不同的選項。每種類型都適用於一組特定的用例。
- sync——將進程分叉成 N 個並行運行的進程來處理請求。
- gthread——產生 N 個執行緒來並發服務請求。
- eventlet/gevent-產生綠色執行緒來並發服務請求。
Gunicorn sync worker
這是最簡單的工作類型,其中唯一的並發選項是分叉N個進程,它們將並行地服務請求。
它們可以很好地工作,但會招致大量開銷(例如記憶體和CPU上下文切換),而且如果您的大部分請求時間都在等待I/O,那麼伸縮性就不好。
Gunicorn gthread worker
gthread worker 透過讓您為每個流程建立 N 個執行緒來改進這一點。這提高了 I/O 效能,因為您可以同時執行更多程式碼實例。這是受 GIL 影響的四個中唯一一個。
Gunicorn eventlet and gevent workers
eventlet/gevent workers試圖透過執行輕量級使用者執行緒(又稱綠色執行緒、greenlets 等)來進一步改進 gthread 模型。
與系統執行緒相比,這允許您以很少的成本擁有數千個所述的greenlet。 另一個差異是它遵循協作工作模式而不是搶佔式,允許不間斷工作,直到它們阻塞為止。我們將首先分析 gthread 工作執行緒在處理請求時的行為以及它如何受 GIL 影響。
與每個請求直接由一個進程提供服務的sync不同,使用gthread,每個進程都有N 個線程,以便更好地擴展,而無需產生多個進程的開銷。由於您在同一個進程中運行多個線程,GIL 將阻止它們並行運行。
GIL 不是行程或特殊執行緒。它只是一個布林變量,其存取受互斥鎖保護,用於確保每個進程內只有一個執行緒在運行。它的運作方式可以在上圖中看到。在這個例子中,我們可以看到我們有 2 個系統執行緒並發運行,每個執行緒處理 1 個請求。流程是這樣的:
- 執行緒 A 持有 GIL 開始服務請求。
- 過了一會兒,執行緒 B 嘗試提供請求,但無法持有 GIL。
- B 設定逾時以強制釋放 GIL,如果在達到逾時之前不會發生這種情況。
- A 在達到逾時之前不會釋放 GIL。
- B 設定 gil_drop_request 標誌以強制 A 立即釋放 GIL。
- A 釋放 GIL 並將等待直到另一個執行緒抓取 GIL,以避免出現 A 會不斷釋放並抓取 GIL 而其他執行緒無法抓取它的情況。
- B 開始運作。
- B 在阻塞 I/O 的同時釋放 GIL。
- A 開始運行。
- B 嘗試再次運行但被暫停。
- A 在達到逾時之前完成。
- B 跑完畢。
相同的場景,但使用gevent
#在不使用進程的情況下增加並發性的另一個選擇是使用greenlets。該worker產生“用戶線程”而不是“系統線程”以增加並發性。
儘管這意味著它們不受 GIL 的影響,但這也意味著您仍然無法增加並行度,因為它們無法由 CPU 並行調度。
- Greenlet A將開始運行,直到發生I/O事件或執行完畢。
- Greenlet B將等待直到Greenlet A釋放事件循環。
- A結束。
- B開始。
- B釋放事件循環以等待I/O。
- B完成。
對於這種情況,很明顯,擁有一個 greenlet 類型的worker並不理想。我們最終讓第二個請求等到第一個請求完成,然後再次空閒等待 I/O。
在這些場景中,greenlet 協作模型真的很出色,因為您不會在上下文切換上浪費時間並避免運行多個系統執行緒的開銷。
我們將在本文最後的基準測試中見證這一點。 現在,這引出了以下問題:
- 更改執行緒上下文切換超時是否會影響服務延遲和吞吐量?
- 當您混合使用 I/O 和 CPU 工作時,如何在 gevent/eventlet 和 gthread 之間進行選擇。
- 如何使用 gthread worker 選擇執行緒數。
- 我應該只使用sync worker並增加分叉進程的數量來避免 GIL 嗎?
要回答這些問題,您需要進行監控以收集必要的指標,然後針對這些相同的指標執行量身定制的基準測試。執行與您的實際使用模式零相關性的綜合基準測試是沒有用的 下圖顯示了不同場景的延遲和吞吐量指標,讓您了解這一切是如何協同工作的。
對 GIL 切換間隔進行基準測試
在這裡我們可以看到更改 GIL 執行緒切換間隔/逾時如何影響請求延遲。正如預期的那樣,IO 延遲隨著切換間隔的降低而變得更好。發生這種情況是因為受 CPU 限制的執行緒被迫更頻繁地釋放 GIL 並允許其他執行緒完成它們的工作。
但這不是靈丹妙藥。減少切換間隔將使 CPU 綁定執行緒需要更長的時間才能完成。我們也可以看到總延遲增加,由於恆定執行緒切換的開銷增加,超時時間減少。如果您想自己嘗試,可以使用以下程式碼變更切換間隔:
#使用CPU 綁定請求對gthread 與gevent 延遲進行基準測試
#總的來說,我們可以看到基準測試反映了我們先前對GIL 綁定執行緒和greenlet 如何運作的分析所產生的直覺。
由於切換間隔迫使長時間運行的執行緒釋放,gthread 對於 IO 綁定請求具有更好的平均延遲。
gevent CPU 綁定請求比 gthread 具有更好的延遲,因為它們不會中斷以服務其他請求。
使用CPU 綁定請求對gthread 與gevent 吞吐量進行基準測試
這裡的結果也反映了我們之前對gevent 比gthread具有更好吞吐量的直覺。這些基準高度依賴完成的工作類型,不一定直接轉換為您的用例。
這些基準測試的主要目標是為您提供一些有關測試和測量內容的指南,以便最大限度地提高將服務於請求的每個 CPU 核心。
由於所有 gunicorn worker 都允許您指定將運行的進程數,因此更改的是每個進程如何處理並發連接。因此,請確保使用相同數量的worker以使測試公平。現在讓我們嘗試使用從我們的基準測試中收集的數據來回答前面的問題。
更改執行緒上下文切換逾時是否會影響服務延遲和吞吐量?
#確實如此。然而,對於絕大多數工作負載來說,它並沒有改變遊戲規則。
當您混合使用 I/O 和 CPU 工作時,如何在 gevent/eventlet 和 gthread 之間進行選擇?正如我們所看到的,當您有更多 CPU 密集型工作時,ghtread 往往允許更好的並發性。
如何選擇gthread worker的執行緒數?
只要您的基準測試能夠模擬類似生產的行為,您就會清楚地看到峰值效能,然後它會因線程過多而開始下降。
我應該只使用同步工作者並增加分叉進程的數量來避免 GIL 嗎?
除非您的 I/O 幾乎為零,否則僅使用進程進行擴充並不是最佳選擇。
結論
Coroutines/Greenlets 可以提高 CPU 效率,因為它們避免了執行緒之間的中斷和上下文切換。協程用延遲換取吞吐量。
如果您混合使用 IO 和 CPU 綁定端點,協程可能會導致更難以預測的延遲-CPU 綁定端點不會中斷以服務其他傳入請求。如果您花時間正確配置 gunicorn,GIL 不是問題。
以上是一文搞懂 Gunicorn 與 Python GIL的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

PHP主要是過程式編程,但也支持面向對象編程(OOP);Python支持多種範式,包括OOP、函數式和過程式編程。 PHP適合web開發,Python適用於多種應用,如數據分析和機器學習。

PHP適合網頁開發和快速原型開發,Python適用於數據科學和機器學習。 1.PHP用於動態網頁開發,語法簡單,適合快速開發。 2.Python語法簡潔,適用於多領域,庫生態系統強大。

在 Sublime Text 中運行 Python 代碼,需先安裝 Python 插件,再創建 .py 文件並編寫代碼,最後按 Ctrl B 運行代碼,輸出會在控制台中顯示。

PHP起源於1994年,由RasmusLerdorf開發,最初用於跟踪網站訪問者,逐漸演變為服務器端腳本語言,廣泛應用於網頁開發。 Python由GuidovanRossum於1980年代末開發,1991年首次發布,強調代碼可讀性和簡潔性,適用於科學計算、數據分析等領域。

Python更適合初學者,學習曲線平緩,語法簡潔;JavaScript適合前端開發,學習曲線較陡,語法靈活。 1.Python語法直觀,適用於數據科學和後端開發。 2.JavaScript靈活,廣泛用於前端和服務器端編程。

Golang在性能和可擴展性方面優於Python。 1)Golang的編譯型特性和高效並發模型使其在高並發場景下表現出色。 2)Python作為解釋型語言,執行速度較慢,但通過工具如Cython可優化性能。

在 Visual Studio Code(VSCode)中編寫代碼簡單易行,只需安裝 VSCode、創建項目、選擇語言、創建文件、編寫代碼、保存並運行即可。 VSCode 的優點包括跨平台、免費開源、強大功能、擴展豐富,以及輕量快速。

在 Notepad 中運行 Python 代碼需要安裝 Python 可執行文件和 NppExec 插件。安裝 Python 並為其添加 PATH 後,在 NppExec 插件中配置命令為“python”、參數為“{CURRENT_DIRECTORY}{FILE_NAME}”,即可在 Notepad 中通過快捷鍵“F6”運行 Python 代碼。
