一、為什麼使用Redis
在專案中使用Redis,筆者認為需要從表現和並發兩個方面來考慮。當然,Redis也具備可做分散式鎖等功能的其它功能,但如果只是為了分散式鎖這些其它功能,完全還有其它中間件(如Zookpeer等)可以代替,並不是非要使用Redis。
因此,這個問題主要從效能和並發兩個角度去答:
1、效能
#如下圖所示,我們在碰到需要執行耗時特別久、且結果不頻繁變動的SQL時,就特別適合將運作結果放入快取。這樣,後面的請求就去快取中讀取,使得請求能夠快速回應。
題外話:忽然想聊聊這個迅速回應的標準-其實根據互動效果的不同,這個回應時間沒有固定標準。有人曾經向我表達的意思是:「理想情況下,我們的頁面跳躍應該瞬間完成,而頁內操作需要在剎那間完成。」。另外,超過一彈指的耗時操作要有進度提示,並且可以隨時中止或取消,這樣才能給使用者最好的體驗。 」
那麼瞬間、剎那、一彈指具體是多少時間呢?
根據《摩訶僧祗律》記載:一剎那者為一念,二十念為一瞬,二十瞬為一彈指,二十彈指為一羅預,二十羅預為一須臾,一日一夜有三十須臾。
那麼,經過周密的計算,一瞬間為0.36秒,一剎那有0.018秒,一彈指長達7.2秒。
2、並發
當並發量很高時,所有請求直接存取資料庫會導致資料庫連線異常,如圖所示。為了避免直接存取資料庫,我們可以在這種情況下使用Redis做緩衝操作,讓請求先存取Redis。
二、使用Redis有什麼缺點
大家用Redis這麼久,這個問題是必須要了解的,基本上使用Redis都會碰到一些問題,常見的主要是四方面的問題:
1、快取和資料庫雙寫一致性問題
2、快取雪崩問題
3、快取擊穿問題
4、快取的並發競爭問題
這四個問題,筆者個人覺得在專案中比較常遇見,具體解決方案,後文會給出。
三、單線程的Redis為什麼這麼快
這個問題其實是對Redis內部機制的一個考察。在筆者的面試經驗中,實際上許多人沒有意識到Redis採用單線程工作模型。所以,這個問題還是應該要複習一下的。主要是以下三點:
1、純記憶體操作
2、單執行緒操作,避免了頻繁的上下文切換
# 3.採用了非阻塞I/O多路復用機制
讓我們更詳細地討論一下I/O多路復用機制,因為這個術語過於通俗,普通人不能理解其含義。打一個比方:小曲在S城開了一家快遞店,負責同城快遞服務。由於資金限制,小曲最初僱用了很多快遞員,但後來發現只有購買一輛車才有足夠的資金運營快遞。
經營方式一:
客戶每送來一份快遞,小曲就讓一個快遞員盯著,然後快遞員開車去送快遞。慢慢的小曲就發現了這種經營方式存在很多問題,幾十個快遞員基本上時間都花在了搶車上了,大部分快遞員都處在閒置狀態,誰搶到了車,誰就能去送快遞。
隨著快遞的增多,快遞員也越來越多,小曲發現快遞店裡越來越擠,沒辦法僱用新的快遞員了,快遞員之間的協調很花時間,大部分時間花在搶車上。綜合上述缺點,小曲痛定思痛,提出了下面的經營方式↓
經營方式二:
小曲只聘用了一個快遞員,將客戶送來的快遞按照目的地分類標註後,整齊地放置在一個地方。最終,快遞員依序取快遞,一一拿走,駕車送出快遞後再返回取得下一個快遞。
上述兩種經營方式對比,是不是明顯覺得第二種,效率更高、更好呢?在上述比喻中:
1、每個快遞員→每個執行緒
2、每個快遞→每個Socket(I/O串流)
3、快遞的送達地點→Socket的不同狀態
4、客戶送快遞請求→來自客戶端的請求
5、小曲的經營方式→服務端運行的代碼
#6、一輛車→CPU的核數
於是我們有以下結論:
1、經營方式一就是傳統的並發模型,每個I/O流(快遞)都有一個新的線程(快遞員)管理。
2、經營方式二就是I/O多工。一個快遞員透過追蹤每個I/O流的狀態,來管理多個I/O流,類似於快遞員只有單獨一人去送達每個包裹,且需知道每個包裹的送達情況。
下面類比到真實的Redis執行緒模型,如圖所示:
#參考上圖,簡單來說就是,我們的Redis-client在操作的時候,會產生不同事件類型的Socket。在服務端,有一段I/O多重化程序,將其置入佇列之中。然後檔案事件分派器依序去佇列中取,轉送到不同的事件處理器中。
要說明的是,這個I/O多工機制,Redis也提供了Select、Epoll、Evport、Kqueue等多工函數庫,大家可以自行去了解。
四、Redis的資料型別及各自使用場景
看到這個問題,是不是覺得它很基礎?其實筆者也這麼覺得。然而根據面試經驗發現,至少有80%的人答不上這個問題。建議在專案中用到後,再類比記憶,體會更深,不要硬記。基本上,一個合格的程式設計師五種型別都會用到:
1、String
這個其實沒什麼好說的,最常規的Set/Get操作,Value可以是String也可以是數字,一般做一些複雜的計數功能的快取。
2、Hash
#這裡的Value是包含結構化物件的變量,它允許方便操作其中的特定字段。筆者在做單一登入的時候,就是用這種資料結構儲存使用者訊息,以CookieId作為Key,設定30分鐘為快取過期時間,能很好地模擬出類似Session的效果。
3、List
#使用List的資料結構,可以做簡單的訊息佇列的功能。除此之外,還可以使用 Redis 的 Lrange 指令來實現分頁功能,其效能非常優異,能夠提供良好的使用者體驗。
4、Set
#因為Set堆疊的是一堆不重複值的集合,所以可以做全域去重的功能。
為什麼不用JVM自帶的Set進行去重?因為我們的系統通常都是叢集部署,使用JVM自帶的Set比較麻煩,難道為了做一個全域去重,再起一個公共服務?太麻煩了。
另外,就是利用交集、並集、差集等操作,可以計算共同喜好、全部的喜好、自己獨有的喜好等功能。
5、Sorted Set
透過給予集合中的元素賦予Score參數,Sorted Set可以根據Score對元素進行排序。可以做排行榜應用,取TOP N操作。另外,Sorted Set還可以用來做延時任務。最後一個應用就是可以做範圍查找。
五、Redis的過期策略及記憶體淘汰機制
這個問題的重要性不言而喻,它能揭示Redis是否得到了正確的應用。例如,如果你的Redis只能儲存5G的數據,而你寫入了10G,則會刪除5G的數據。怎麼刪的?這個問題思考過麼?還有,你的資料已經設定了過期時間,但是時間到了,記憶體佔用率還是比較高,有思考過原因麼?
Redis 採用的是定期刪除 惰性刪除策略。
為什麼不用定時刪除策略?
定時刪除,使用計時器來負責監視Key,過期則會自動刪除。雖然記憶體及時釋放,但是十分消耗CPU資源。在大並發請求下,CPU要將時間應用在處理請求,而不是刪除Key,因此沒有採用此策略。
定期刪除 惰性刪除是如何運作的呢?
定期刪除,Redis預設每個100ms檢查是否有過期的Key,有過期Key則刪除。需要說明的是,Redis不是每個100ms將所有的Key檢查一次,而是隨機抽取檢查(如果每隔100ms,全部Key進行檢查,Redis豈不是卡死)。因此,如果只採用定期刪除策略,會導致許多Key到時間沒有刪除。
於是,惰性刪除派上用場。也就是說在你取得某個Key的時候,Redis會檢查一下,這個Key如果設定了過期時間,那麼是否過期了?如果過期了此時就會刪除。
採用定期刪除 惰性刪除就沒其他問題了麼?
不是的,如果定期刪除沒刪除Key。然後你也沒及時去請求Key,也就是說惰性刪除也沒生效。為了防止Redis的記憶體不斷增加,需要啟用記憶體淘汰機制。
在Redis.conf中有一行配置:
# maxmemory-policy volatile-lru
該配置就是配記憶體淘汰策略的:
Noeviction:當記憶體不足以容納新寫入資料時,新寫入操作會報錯。應該沒人使用;
Allkeys-lru:當記憶體不足以容納新寫入資料時,在鍵空間中,移除最近最少使用的Key。建議使用,目前項目在用這種;
Allkeys-random:當記憶體不足以容納新寫入資料時,在鍵空間中,隨機移除某個key,應該也沒人使用吧;
Volatile-lru:當記憶體不足以容納新寫入資料時,在設定了過期時間的鍵空間中,移除最近最少使用的Key 。這種情況一般是把Redis既當快取又做持久化儲存的時候才用。不推薦;
Volatile-random:當記憶體不足以容納新寫入資料時,在設定了過期時間的鍵空間中,隨機移除某個Key。依然不推薦;
Volatile-ttl:當記憶體不足以容納新寫入資料時,在設定了過期時間的鍵空間中,有更早過期時間的Key優先移除。不推薦。
PS:如果沒有設定Expire的Key,不滿足先決條件(Prerequisites);那麼Volatile-lru、Volatile-random和Volatile-ttl策略的行為,和Noeviction(不刪除)基本上一致。
六、Redis與資料庫雙寫一致性問題
一致性問題是分散式常見問題,還可以再分為最終一致性和強一致性。資料庫和快取雙寫,就必然會有不一致的問題,想要回答這個問題,就要先明白一個前提:如果對資料有強一致性要求,就不能放快取。我們所做的一切,只能保證最終一致性。
我們提出的方案只能減少不一致發生的可能性,而不能完全杜絕。因此,有強一致性要求的資料不能放快取。
《分散式資料庫與快取雙寫一致性方案解疑》
#給出了詳細的分析,在這裡簡單地說一說:首先,採取正確更新策略,先更新資料庫,再刪除快取;其次,因為可能存在刪除快取失敗的問題,提供一個補償措施即可,例如利用訊息佇列。
七、應對快取穿透和快取雪崩問題
一般中小型傳統軟體企業很少會遇到快取穿透和快取雪崩這兩個問題。如果要處理數百萬層級的流量,這兩個問題必須經過深思熟慮:
#1、應對快取穿透
##快取穿透,也就是駭客故意去請求快取中不存在的數據,導致所有的請求都懟到資料庫上,從而資料庫連線異常。 解決方案:利用互斥鎖,快取失效的時候,先去取得鎖,得到鎖了,再去請求資料庫,沒得到鎖,則休眠一段時間重試; 1、採用非同步更新策略,無論Key是否取到值,都直接回傳。 Value值中維護一個快取失效時間,快取如果過期,異步起一個執行緒去讀資料庫,更新緩存,需要做快取預熱(專案啟動前,先載入快取)操作;#2、提供一個能迅速判斷請求是否有效的攔截機制,例如利用布隆過濾器,內部維護一系列合法有效的Key,迅速判斷出,請求所攜帶的Key是否合法有效,如果不合法,則直接返回。2、應對快取雪崩
#快取雪崩,也就是快取相同時間大面積的失效,這個時候又來了一波請求,結果請求都懟到資料庫上,導致資料庫連線異常。 解決方案:1、給快取的失效時間加上一個隨機值,避免集體失效;2、使用互斥鎖,但是此方案吞吐量明顯下降了;3、雙緩存。我們有兩個緩存,緩存A和緩存B。快取A的失效時間為20分鐘,快取B不設失效時間,自行做快取預熱操作。 然後細分以下幾個小點:a. 從快取A讀取資料庫,有則直接返回;八、如何解決Redis並發競爭Key問題
這個問題大致就是同時有多個子系統去Set一個Key。在這種情況下,應該注意使用Redis事務機制。根據我提前在百度上的搜尋結果,大部分人推薦使用這種方法。但本人不建議使用Redis的事務機制。我們在生產環境中主要使用Redis集群,並且進行了資料分片處理。當你在一個事務中涉及多個Key操作時,這些Key不一定都儲存在同一個Redis-Server上。因此,Redis的事務機制,十分雞肋。 解決方法如下:如果對這個Key操作不要求順序
這種情況下,準備一個分散式鎖,大家去搶鎖,搶到鎖就做Set操作即可,比較簡單。如果對這個Key運算要求順序#
假設有Key1,系統A需要將Key1設定為ValueA,系統B需要將Key1設定為ValueB,系統C需要將Key1設定為ValueC。希望根據Key1的Value值以ValueA→ValueB→ValueC的順序變化。這種時候我們在資料寫入資料庫的時候,需要保存一個時間戳記。假設時間戳如下:
1、系統A Key 1 {ValueA 3:00}
2、系統B Key 1 {ValueB 3:05}
#3、系統C Key 1 {ValueC 3:10}
那麼,假設這會系統B先搶到鎖,將Key1設為{ValueB 3:05}。如果系統A搶到鎖定後發現其ValueA的時間戳記早於快取中的時間戳,則不會執行Set操作。以此類推。
#以上是Redis的技術要點有哪些的詳細內容。更多資訊請關注PHP中文網其他相關文章!