首頁 > 資料庫 > Redis > 圖文詳解Redis集群與擴展

圖文詳解Redis集群與擴展

WBOY
發布: 2022-07-13 20:25:08
轉載
1880 人瀏覽過

這篇文章為大家帶來了關於Redis的相關知識,其中主要整理了叢集與擴充的相關問題,實現高可用通常的做法是將資料庫複製多個副本以部署在不同的伺服器上,其中一台掛了也可以繼續提供服務,實現高可用有三種部署模式:主從模式,哨兵模式,集群模式,下面一起來看一下,希望對大家有幫助。

圖文詳解Redis集群與擴展

推薦學習:Redis影片教學

#

Redis的高可用

1.為什麼要高可用

  • 防止單點故障,造成整個叢集不可用
  • 實現高可用通常的做法是將資料庫複製多個副本以部署在不同的伺服器上,其中一台掛了也可以繼續提供服務
  • Redis實現高可用有三種部署模式:主從模式,哨兵模式,叢集模式

2.主從模式

  • #主節點負責讀寫運算
  • #從節點只負責讀取操作
  • 從節點的資料來自主節點,實作原理就是主從複製機制
  • 主從複製包含全量複製,增量複製兩種
  • #當slave第一次啟動連線master,或認為第一次連接就採用全量複製
    圖文詳解Redis集群與擴展
  • slave與master全量同步之後,master上的資料如果再次發生更新,就會觸發增量複製
    圖文詳解Redis集群與擴展

3.哨兵模式

  • 主從模式中,一旦主節點因故障無法提供服務,需要人工將從節點晉升為主節點,同時也要通知應用方更新主節點位址,顯然多數業務場景都不能接受這種故障處理方式,Redis從2.8開始正式提供了Redis Sentinel(哨兵)架構來解決這個問題
  • 哨兵模式是由一個或多個Sentinel實例組成的Sentinel系統,可以監視所有的Redis主節點和從節點,並在被監視的主節點進入下線狀態時自動將下線主伺服器屬下的某個從節點升級為新的主節點
  • 但是一個哨兵程序對Redis節點進行監控,就可能會出現問題(單點),因此可以使用多個哨兵來進行監控Redis節點,各個哨兵之間也會進行監控
    圖文詳解Redis集群與擴展
  • 簡單來說,哨兵模式就三個作用
1.发送命令,等待Redis服务器(包括主服务器和从服务器)返回监控其运行状态
2.哨兵监测到主节点宕机会自动将从节点切换成主节点,然后通过发布订阅模式通知其他的从节点修改配置文件,让它们切换主机
3.哨兵之间还会相互监控,从而达到高可用
登入後複製
  • #故障切換程序如下
假设主服务器宕机,哨兵1先检测到这个结果,系统并不会马上进行 failover 过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象称为主观下线
当后面的哨兵也检测到主服务器不可用并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover操作
切换成功后通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这个过程称为客观下线
这样对于客户端而言,一切都是透明的
登入後複製
  • 哨兵的工作模式
每个Sentinel以每秒钟一次的频率向它所知的Master,Slave以及其他Sentinel实例发送一个PING命令
如果实例距离最后一次有效回复PING命令的时间超过down-after-milliseconds选项所指定的值,则这个实例会被Sentinel标记为主观下线
如果一个Master被标记为主观下线,则正在监视这个Master的所有Sentinel要以每秒一次的频率确认Master的确进入了主观下线状态
当有足够数量的Sentinel(大于等于配置文件指定的值)在指定的时间范围内确认Master的确进入了主观下线状态,则Master会被标记为客观下线
一般情况下,每个Sentinel会以每10秒一次的频率向它已知的所有Master,Slave发送INFO命令
当Master被Sentinel标记为客观下线时,Sentinel向下线的Master的所有Slave发送INFO命令的频率会从10秒一次改为每秒一次
若没有足够数量的Sentinel同意Master已经下线,Master的客观下线状态就会被移除;若Master重新向Sentinel的PING命令返回有效回复,Master 的主观下线状态就会被移除
登入後複製

4.Cluster叢集模式

  • 哨兵模式基於主從模式,實現讀寫分離,還可以自動切換,系統可用性更高,但是它每個節點存儲的數據是一樣的,浪費內存,並且不好在線擴容,因此Cluster集群應運而生,它在Redis3.0加入的
  • Cluster叢集實作Redis的分散式儲存,對資料進行分片,也就是說每台Redis節點上儲存不同的內容,來解決線上擴容的問題,而且它也提供複製和故障轉移的功能
  • Redis Cluster叢集透過Gossip協定進行通訊,節點之間不斷交換訊息,交換的訊息內容包括節點故障、新節點加入、主從節點變更訊息、slot訊息等等,常用的Gossip訊息分別是ping、pong、meet、fail
ping消息:集群内交换最频繁的消息,集群内每个节点每秒向多个其他节点发送ping消息,用于检测节点是否在线和交换彼此状态信息
meet消息:通知新节点加入,消息发送者通知接收者加入到当前集群,meet消息通信正常完成后,接收节点会加入到集群中并进行周期性的ping、pong消息交换
pong消息:当接收到ping、meet消息时,作为响应消息回复给发送方确认消息正常通信;pong消息内部封装了自身状态数据,节点也可以向集群内广播自身的pong消息来通知整个集群对自身状态进行更新
fail消息:当节点判定集群内另一个节点下线时,会向集群内广播一个fail消息,其他节点接收到fail消息之后把对应节点更新为下线状态
登入後複製
  • Hash Slot插槽演算法
既然是分布式存储,Cluster集群使用的分布式算法是一致性Hash嘛?并不是,而是Hash Slot插槽算法
插槽算法把整个数据库被分为16384个slot(槽),每个进入Redis的键值对根据key进行散列,分配到这16384插槽中的一个
使用的哈希映射也比较简单,用CRC16算法计算出一个16位的值,再对16384取模,数据库中的每个键都属于这16384个槽的其中一个,集群中的每个节点都可以处理这16384个槽
集群中的每个节点负责一部分的hash槽,比如当前集群有A、B、C个节点,每个节点上的哈希槽数 =16384/3,那么就有:
	节点A负责0~5460号哈希槽
	节点B负责5461~10922号哈希槽
	节点C负责10923~16383号哈希槽Redis Cluster集群中,需要确保16384个槽对应的node都正常工作,如果某个node出现故障,它负责的slot也会失效,整个集群将不能工作
为了保证高可用,Cluster集群引入了主从复制,一个主节点对应一个或者多个从节点,当其它主节点ping一个主节点A时,如果半数以上的主节点与 A通信超时,那么认为主节点A宕机,如果主节点宕机时,就会启用从节点Redis的每一个节点上都有两个玩意,一个是插槽slot(0~16383),另外一个是cluster,可以理解为一个集群管理的插件,当我们存取的key到达时,Redis会根据Hash Slot插槽算法取到编号在0~16383之间的哈希槽,通过这个值去找到对应的插槽所对应的节点,然后直接自动跳转到这个对应的节点上进行存取操作
登入後複製

5.實現高可用後的故障轉移問題

  • 主觀下線: 某個節點認為另一個節點不可用,即下線狀態,這個狀態並不是最終的故障判定,只能代表一個節點的意見,可能存在誤判情況
    圖文詳解Redis集群與擴展
  • 客觀下線: 標記一個節點真正的下線,叢集內多個節點都認為該節點不可用,從而達成共識的結果,如果是持有槽的主節點故障,需要為此節點進行故障轉移
    圖文詳解Redis集群與擴展
  • 故障復原:故障發現後,如果下線節點的是主節點,則需要在它的從節點中選取一個替換它,以確保叢集的高可用
    圖文詳解Redis集群與擴展

Redis分散式鎖定帶來的系列問題及解決

#1.Redisson

  • 分散式鎖定可能有鎖定過期釋放,業務沒執行完的問題
  • 能不能將鎖定的過期時間設定得長點來解決此問題呢?顯然是不太好的,業務的執行時間是不確定的
  • Redisson解決該問題,給獲得鎖得線程開啟定時守護線程,每隔一段時間檢查鎖是否存在,存在則延長鎖的過期時間,防止鎖定過期提前釋放
    圖文詳解Redis集群與擴展

2.Redlock演算法

  • 線程一在Redis的master節點上拿到了鎖,但是加鎖的key還沒同步到slave節點,剛好這時master節點發生故障,一個slave節點就會升級為master節點,線程二就可以取得同個key的鎖啦,但線程一也已經拿到鎖了,鎖的安全性就沒了
    圖文詳解Redis集群與擴展
  • Redlock解決這個問題,即部署多個Redis master以保證它們不會同時宕掉,並且這些master節點是完全相互獨立的,相互之間不存在資料同步,實作步驟如下
    圖文詳解Redis集群與擴展

#MySQL與Redis如何保證雙寫一致性

#1.延時雙刪

  • 更新資料庫後延遲休眠一會再刪除快取
  • 這種方案還可以,只有休眠那一會可能有髒數據,一般業務也會接受的
  • 但是如果第二次刪除快取失敗呢?快取和資料庫的資料還是可能不一致
  • 給Key設定一個自然的expire過期時間,讓它自動過期怎麼樣?業務在該過期時間內接受的資料的不一致怎麼辦?還是有其他更佳方案
    圖文詳解Redis集群與擴展

2.刪除快取重試機制

  • 延時雙刪可能會存在第二步驟的刪除緩存失敗,導致的資料不一致問題
  • 刪除失敗就多刪除幾次呀,保證刪除快取成功就可以了呀,所以可以引入刪除快取重試機制
    圖文詳解Redis集群與擴展

#3.讀取biglog非同步刪除快取

  • 重試刪除快取機制會造成好多業務程式碼入侵,所以引入讀取biglog非同步刪除快取
    圖文詳解Redis集群與擴展

推薦學習:Redis影片教學

以上是圖文詳解Redis集群與擴展的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:csdn.net
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板