以前一直有個誤解,以為:高效能伺服器 一定是多執行緒來實現的
原因很簡單因為迷思二導致的: 多執行緒一定比單線程 效率高。其實不然。
redis 核心就是如果我的資料全都在記憶體裡,我單線程的去操作就是效率最高的,為什麼呢,因為多線程的本質就是CPU 模擬出來多個線程的情況,這種模擬出來的情況就有一個代價,就是上下文的切換,對於一個記憶體的系統來說,它沒有上下文的切換就是效率最高的。
redis用單一CPU 綁定一塊記憶體的數據,然後針對這塊記憶體的數據進行多次讀寫的時候,都是在一個CPU上完成的,所以它是單線程處理這個事。 在記憶體的情況下,這個方案就是最佳方案。 (推薦:《redis影片教學》)
因為一次CPU上下文的切換大概在 1500ns 左右。
從記憶體中讀取1MB 的連續數據,耗時大約為250us,假設1MB的數據由多個線程讀取了1000次,那麼就有1000次時間上下文的切換,
那麼就有1500ns * 1000 = 1500us ,我單線程的讀完1MB數據才250us ,你光時間上下文的切換就用了1500us了,我還不算你每次讀一點數據的時間,
那什麼時候用多執行緒的方案呢?
答案是:下層的儲存等慢速的情況。例如磁碟
內存是一個 IOPS 非常高的系統,因為我想申請一塊內存就申請一塊內存,銷毀一塊內存我就銷毀一塊內存,內存的申請和銷毀是很容易的。而且記憶體是可以動態的申請大小的。
磁碟的特性是:IPOS很低很低,但吞吐量很高。這就意味著,大量的讀寫操作都必須存在一起,再提交到磁碟的時候,效能最高。為什麼呢?
如果我有一個事務組的操作(就是幾個已經分開了的事務請求,比如寫讀寫讀寫,這麼五個操作在一起),在內存中,因為IOPS非常高,我可以一個一個的完成,但是如果在磁碟中也有這種請求方式的話,
我第一個寫操作是這樣完成的:我先在硬碟中尋址,大概花費10ms,然後我讀一個資料可能花費1ms然後我再運算(忽略不計),再寫回硬碟又是10ms ,總共21ms
第二個操作去讀花了10ms, 第三個又是寫花費了21ms ,然後我再讀10ms, 寫21ms ,五個請求總共花費83ms,這還是最理想的情況下,這如果在內存中,大概1ms不到。
所以對於磁碟來說,它吞吐量這麼大,那麼最好的方案肯定是我將N個請求一起放在一個buff裡,然後一起去提交。
方法就是用非同步:將請求和處理的線程不綁定,請求的線程將請求放在一個buff裡,然後等buff快滿了,處理的線程再去處理這個buff。然後由這個buff 統一的去寫入磁碟,或是讀磁碟,這樣效率就是最高。 java裡的IO不就是這麼做的麼~
對於慢速設備,這種處理方式就是最佳的,慢速設備有磁盤,網絡,SSD 等等,
多線程,非同步的方式處理這些問題非常常見,大名鼎鼎的netty 就是這麼做的。
終於把redis 為什麼是單線程說清楚了,把什麼時候用單線程跟多線程也說清楚了,其實也是些很簡單的東西,只是基礎不好的時候,就真的尷尬。 。 。 。
補一發大師語錄:來說說,為何單核cpu綁定一塊內存效率最高
“我們不能任由操作系統負載均衡,因為我們自己更了解自己的程序,所以我們可以手動地為其分配CPU核,而不會過多地佔用CPU”,預設情況下單線程在進行系統調用的時候會隨機使用CPU內核,為了優化Redis,我們可以使用工具為單線程綁定固定的CPU內核,減少不必要的效能損耗!
redis作為單一進程模型的程序,為了充分利用多核心CPU,常常在一台server上會啟動多個實例。 而為了減少切換的開銷,有必要為每個實例指定其所執行的CPU。
Linux 上 taskset 可以將某個行程綁定到一個特定的CPU。你比作業系統更了解自己的程序,為了避免調度器愚蠢的調度你的程序,或是為了在多線程程序中避免緩存失效造成的開銷。
以上是redis為什麼是單線程的詳細內容。更多資訊請關注PHP中文網其他相關文章!