手把手帶你搞懂Redis高可用集群-Redis-PHP中文網

如何保存更多資料？

Redis 叢集

搭建 Redis 叢集

客户端如何定位数据？

计算键属于哪个槽

判断槽是否由当前节点负责处理

MOVED 错误

重新分片

ASK 错误

ASK 和 MOVED 的区别

复制与故障转移

故障检测

故障转移

选主

消息

首頁

資料庫

Redis

手把手帶你搞懂Redis高可用集群

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Mar 04, 2022 pm 05:03 PM

redis

這篇文章為大家帶來了關於Redis的相關知識，其中主要介紹了叢集的相關問題，Redis叢集是一種分散式資料庫方案，叢集透過分片來進行資料共享，並提供複製和故障轉移功能，希望對大家有幫助。

手把手帶你搞懂Redis高可用集群

推薦學習：Redis學習教學

幾種 Redis 高可用性的解決方案。包括：「主從模式」、「哨兵機制」以及「哨兵集群」。

「主從模式」具有讀寫分離，分擔讀取壓力、資料備份，提供多個副本等優點。
「哨兵機制」在主節點故障後能自動將從節點提升成主節點，不需要人工幹預操作就能恢復服務可用。
「哨兵叢集」解決單點故障以及單機哨兵產生「誤判」問題。

Redis 從最簡單的單機版，經過資料持久化、主從多副本、哨兵集群，透過這麼一番的優化，不管是性能還是穩定性，都越來越高。

但是隨著時間的發展，公司業務量迎來了爆炸性成長，此時的架構模型，還能夠承擔這麼大的流量嗎？

例如有這麼一個需求：要用Redis 保存5000 萬個鍵值對，每個鍵值對大約是512B，為了能快速部署並對外提供服務，我們採用雲端主機來運行Redis 實例，那麼，該如何選擇雲端主機的記憶體容量呢？

透過計算，這些鍵值對所佔的記憶體空間大約是 25GB（5000 萬 *512B）。

想到的第一個方案就是：選擇一台 32GB 記憶體的雲端主機來部署 Redis。因為 32GB 的記憶體能保存所有數據，而且還留有 7GB，可以確保系統的正常運作。

同時，也採用 RDB 對資料做持久化，以確保 Redis 實例故障後，還能從 RDB 恢復資料。

但是，在使用的過程中會發現，Redis 的回應有時會非常慢。透過 INFO指令 查看 Redis 的latest_fork_usec指標值（表示最近一次 fork 的耗時），結果發現這個指標值特別高。

這跟 Redis 的持久化機制有關係。

在使用RDB 進行持久化時，Redis 會fork 子程序來完成，fork 運算的用時和Redis 的資料量是正相關的，而fork 在執行時會阻塞主執行緒。 資料量越大，fork 操作造成的主執行緒阻塞的時間越長。

所以，在使用RDB 對25GB 的資料進行持久化時，資料量較大，後台運行的子程序在fork 建立時阻塞了主線程，於是就導致Redis 回應變慢了。

顯然這個方案是不可行的，我們必須要尋找其他的方案。

如何保存更多資料？

為了保存大量數據，我們一般有兩種方法：「縱向擴展」和「橫向擴展」：

縱向擴充：升級單一Redis 執行個體的資源配置，包括增加記憶體容量、增加磁碟容量、使用更高配置的CPU；
橫向擴充：橫向增加目前Redis 執行個體的個數。

首先，「縱向擴展」的好處是，實作起來簡單、直接。不過，這個方案也面臨兩個潛在的問題。

第一個問題是，當使用RDB 對資料進行持久化時，如果資料量增加，需要的記憶體也會增加，主執行緒fork 子程序時就可能會阻塞。
第二個問題：縱向擴充會受到硬體和成本的限制。 這很容易理解，畢竟，把記憶體從 32GB 擴展到 64GB 還算容易，但是，要擴充到 1TB，就會面臨硬體容量和成本上的限制了。

與「縱向擴展」相比，「橫向擴展」是擴展性較好的方案。這是因為，要保存更多的數據，採用這種方案的話，只用增加 Redis 的實例個數就行了，不用擔心單一實例的硬體和成本限制。

Redis 集群就是基於「橫向擴展」實現的，透過啟動多個Redis 實例組成一個集群，然後按照一定的規則，把收到的資料劃分成多份，每一份都用一個實例來保存。

Redis 叢集

Redis 叢集是一種分散式資料庫方案，叢集透過分片（sharding，也可以叫切片）來進行資料共享，並提供複製和故障轉移功能。

回到我們剛剛的場景中，如果把 25GB 的資料平均分成 5 份（當然，也可以不做均分），使用 5 個實例來保存，每個實例只需要保存 5GB 資料。如下圖所示：

手把手帶你搞懂Redis高可用集群
那麼，在切片叢集中，實例在為5GB 資料產生RDB 時，資料量就小了很多，fork 子程序一般不會為主執行緒帶來較長時間的阻塞。

採用多個實例保存資料切片後，我們既能保存 25GB 數據，又避免了 fork 子進程阻塞主執行緒而導致的回應突然變慢。

在實際應用 Redis 時，隨著業務規模的擴展，保存大量資料的情況通常是無法避免的。而 Redis 集群，就是一個非常好的解決方案。

下面我們開始研究如何建立一個 Redis 叢集？

搭建 Redis 叢集

一個 Redis 叢集通常由多個節點組成，在剛開始的時候，每個節點都是相互獨立地，節點之間沒有任何關聯。要組成一個可以工作的集群，我們必須將各個獨立的節點連接起來，構成一個包含多節點的集群。

我們可以透過CLUSTER MEET 指令，將各個節點連接起來：

CLUSTER MEET <ip> <port></port></ip>

登入後複製

ip：待加入叢集的節點ip

指令說明：透過向一個節點A 發送

CLUSTER MEET 指令，可以讓接收指令的節點A 將另一個節點B 新增到節點A 所在的集群中。

這麼說有點抽象，下面看一個例子。

假設現在有三個獨立的節點

127.0.0.1:7001、 127.0.0.1:7002、 127.0.0.1:7003。

手把手帶你搞懂Redis高可用集群

我們先使用客戶端連上節點

7001：

$ redis-cli -c -p 7001

登入後複製

然後向節點

7001 發送指令，將節點7002 加入到7001 所在的叢集：

127.0.0.1:7001> CLUSTER MEET 127.0.0.1 7002

登入後複製

相同的，我們向

7003 發送指令，也加入到7001 和7002 所在的叢集。

127.0.0.1:7001> CLUSTER MEET 127.0.0.1 7003

登入後複製

透過
CLUSTER NODES 指令可以查看叢集中的節點資訊。

手把手帶你搞懂Redis高可用集群現在叢集中已經包含
7001、 7002 和 7003 三個節點。不過，在使用單一實例的時候，資料存在哪兒，客戶端存取哪兒，都是非常明確的。但是，切片叢集不可避免地涉及到多個實例的分散式管理問題。

要想把切片集群用起來，我們就需要解決兩大問題：

資料切片後，在多個實例之間如何分佈？
客戶端怎麼決定想要存取的資料在哪個實例上？

接下來，我們就一個個解決。

資料切片和實例的對應分佈關係

在切片叢集中，資料需要分佈在不同實例上，那麼，資料和實例之間如何對應呢？

這就跟接下來要講的

Redis Cluster 方案有關了。不過，我們要先弄清楚切片群集和 Redis Cluster 的聯繫與差異。

在 Redis 3.0 之前，官方並沒有針對切片群集提供具體的方案。從 3.0 開始，官方提供了一個名為
Redis Cluster 的方案，用於實作切片叢集。

實際上，切片叢集是一種保存大量資料的通用機制，這個機制可以有不同的實作方案。

Redis Cluster 方案中就規定了資料和實例的對應規則。

具體來說，

Redis Cluster 方案採用 哈希槽（Hash Slot），來處理資料和實例之間的對應關係。

哈希槽與Redis 實例映射

在

Redis Cluster 方案中，一個切片群集共有16384 個哈希槽(2^14 )，這些哈希槽類似於資料分區，每個鍵值對都會根據它的key，被映射到一個哈希槽中。

在上面我們分析的，透過

CLUSTER MEET 指令將7001、7002、7003 三個節點連接到同一個叢集裡面，但是這個叢集目前是處於下線狀態的，因為叢集中的三個節點沒有分配任何槽。

那麼，這些哈希槽又是如何被映射到具體的 Redis 實例上的呢？

我們可以使用

CLUSTER MEET 指令手動建立實例間的連接，形成集群，再使用CLUSTER ADDSLOTS 指令，指定每個實例上的雜湊槽個數。

CLUSTER ADDSLOTS <slot> [slot ...]</slot>

登入後複製

Redis5.0 提供
CLUSTER CREATE 命令建立集群，使用該命令，Redis 會自動把這些槽平均分佈在集群實例上。

举个例子，我们通过以下命令，给 7001、7002、7003 三个节点分别指派槽。

将槽 0 ~ 槽5000 指派给给 7001 ：

127.0.0.1:7001> CLUSTER ADDSLOTS 0 1 2 3 4 ... 5000

登入後複製

将槽 5001 ~ 槽10000 指派给给 7002 ：

127.0.0.1:7002> CLUSTER ADDSLOTS 5001 5002 5003 5004 ... 10000

登入後複製

将槽 10001~ 槽 16383 指派给给 7003 ：

127.0.0.1:7003> CLUSTER ADDSLOTS 10001 10002 10003 10004 ... 16383

登入後複製

手把手帶你搞懂Redis高可用集群

当三个 CLUSTER ADDSLOTS 命令都执行完毕之后，数据库中的 16384 个槽都已经被指派给了对应的节点，此时集群进入上线状态。

通过哈希槽，切片集群就实现了数据到哈希槽、哈希槽再到实例的分配。

但是，即使实例有了哈希槽的映射信息，客户端又是怎么知道要访问的数据在哪个实例上呢？

客户端如何定位数据？

一般来说，客户端和集群实例建立连接后，实例就会把哈希槽的分配信息发给客户端。但是，在集群刚刚创建的时候，每个实例只知道自己被分配了哪些哈希槽，是不知道其他实例拥有的哈希槽信息的。

那么，客户端是如何可以在访问任何一个实例时，就能获得所有的哈希槽信息呢？

Redis 实例会把自己的哈希槽信息发给和它相连接的其它实例，来完成哈希槽分配信息的扩散。当实例之间相互连接后，每个实例就有所有哈希槽的映射关系了。

客户端收到哈希槽信息后，会把哈希槽信息缓存在本地。当客户端请求键值对时，会先计算键所对应的哈希槽，然后就可以给相应的实例发送请求了。

当客户端向节点请求键值对时，接收命令的节点会计算出命令要处理的数据库键属于哪个槽，并检查这个槽是否指派给了自己：

如果键所在的槽刚好指派给了当前节点，那么节点会直接执行这个命令；
如果没有指派给当前节点，那么节点会向客户端返回一个 MOVED 错误，然后重定向（redirect）到正确的节点，并再次发送之前待执行的命令。

手把手帶你搞懂Redis高可用集群

计算键属于哪个槽

节点通过以下算法来定义 key 属于哪个槽：

crc16(key,keylen) & 0x3FFF;

登入後複製

crc16：用于计算 key 的 CRC-16 校验和
0x3FFF：换算成 10 进制是 16383
& 0x3FFF：用于计算出一个介于 0~16383 之间的整数作为 key 的槽号。

通过 CLUSTER KEYSLOT <key></key>命令可以查看 key 属于哪个槽。

判断槽是否由当前节点负责处理

当节点计算出 key 所属的 槽 i 之后，节点会判断 槽 i 是否被指派了自己。那么如何判断呢？

每个节点会维护一个「slots数组」，节点通过检查 slots[i] ，判断 槽 i 是否由自己负责：

如果说 slots[i] 对应的节点是当前节点的话，那么说明 槽 i 由当前节点负责，节点可以执行客户端发送的命令；
如果说 slots[i] 对应的不是当前节点，节点会根据 slots[i] 所指向的节点向客户端返回 MOVED 错误，指引客户端转到正确的节点。

MOVED 错误

格式：

MOVED  <slot> <ip>:<port></port></ip></slot>

登入後複製

slot：键所在的槽
ip：负责处理槽 slot 节点的 ip
port：负责处理槽 slot 节点的 port

比如：MOVED 10086 127.0.0.1:7002，表示，客户端请求的键值对所在的哈希槽 10086，实际是在 127.0.0.1:7002 这个实例上。

通过返回的 MOVED 命令，就相当于把哈希槽所在的新实例的信息告诉给客户端了。

这样一来，客户端就可以直接和 7002 连接，并发送操作请求了。

同时，客户端还会更新本地缓存，将该槽与 Redis 实例对应关系更新正确。

集群模式的 redis-cli 客户端在接收到 MOVED 错误时，并不会打印出 MOVED 错误，而是根据 MOVED 错误自动进行节点转向，并打印出转向信息，所以我们是看不见节点返回的 MOVED 错误的。而使用单机模式的 redis-cli 客户端可以打印MOVED 错误。

其实，Redis 告知客户端重定向访问新实例分两种情况：MOVED 和 ASK 。下面我们分析下 ASK 重定向命令的使用方法。

重新分片

在集群中，实例和哈希槽的对应关系并不是一成不变的，最常见的变化有两个：

在集群中，实例有新增或删除，Redis 需要重新分配哈希槽；
为了负载均衡，Redis 需要把哈希槽在所有实例上重新分布一遍。

重新分片可以在线进行，也就是说，重新分片的过程中，集群不需要下线。

举个例子，上面提到，我们组成了 7001、7002、7003 三个节点的集群，我们可以向这个集群添加一个新节点127.0.0.1:7004。

$ redis-cli -c -p 7001
127.0.0.1:7001> CLUSTER MEET 127.0.0.1 7004
OK

登入後複製

然后通过重新分片，将原本指派给节点 7003 的槽 15001 ~ 槽 16383 改为指派给 7004。
手把手帶你搞懂Redis高可用集群
在重新分片的期间，源节点向目标节点迁移槽的过程中，可能会出现这样一种情况：如果某个槽的数据比较多，部分迁移到新实例，还有一部分没有迁移咋办？

在这种迁移部分完成的情况下，客户端就会收到一条 ASK 报错信息。

ASK 错误

如果客户端向目标节点发送一个与数据库键有关的命令，并且这个命令要处理的键正好属于被迁移的槽时：

源节点会先在自己的数据库里查找指定的键，如果找到的话，直接执行命令；
相反，如果源节点没有找到，那么这个键就有可能已经迁移到了目标节点，源节点就会向客户端发送一个 ASK 错误，指引客户端转向目标节点，并再次发送之前要执行的命令。

看起来好像有点复杂，我们举个例子来解释一下。

手把手帶你搞懂Redis高可用集群

如上图所示，节点 7003 正在向 7004 迁移 槽 16383，这个槽包含 hello 和 world，其中键 hello 还留在节点 7003，而 world 已经迁移到 7004。

我们向节点 7003 发送关于 hello 的命令这个命令会直接执行：

127.0.0.1:7003> GET "hello"
"you get the key 'hello'"

登入後複製

如果我们向节点 7003 发送 world 那么客户端就会被重定向到 7004：

127.0.0.1:7003>  GET "world"
-> (error) ASK 16383 127.0.0.1:7004

登入後複製

客户端在接收到 ASK 错误之后，先发送一个 ASKING 命令，然后在发送 GET "world" 命令。

ASKING 命令用于打开节点的 ASKING 标识，打开之后才可以执行命令。

ASK 和 MOVED 的区别

ASK 错误和 MOVED 错误都会导致客户端重定向，它们的区别在于：

MOVED 错误代表槽的负责权已经从一个节点转移到了另一个节点：在客户端收到关于 槽 i 的 MOVED 错误之后，客户端每次遇到关于 槽 i 的命令请求时，都可以直接将命令请求发送至 MOVED 错误指向的节点，因为该节点就是目前负责 槽 i的节点。
而 ASK 只是两个节点迁移槽的过程中的一种临时措施：在客户端收到关于 槽 i 的 ASK 错误之后，客户端只会在接下来的一次命令请求中将关于 槽 i 的命令请求发送到 ASK 错误指向的节点，但是，如果客户端再次请求 槽 i 中的数据，它还是会给原来负责 槽 i 的节点发送请求。