Redis マスター/スレーブテクノロジーの分析例-Redis-php.cn

Redis レプリケーション

本番環境では、Redis は永続化機能 (RDB および AOF テクノロジ) を使用して、サーバーが停止している場合でもデータが失われないようにします (またはわずかな損失はありません)。再開した。ただし、データはサーバー上に保存されるため、そのサーバーにハードディスク障害などの問題が発生すると（本番環境では何度も発生します）、データも失われます。データベースをコピーする複数のコピーを異なるサーバーに展開できるため、1 つのサーバーに障害が発生した場合でも、他のサーバーが可能な限り迅速にサービスを提供できます。この目的のために、Redis は、あるデータベースのデータが更新されたときに、更新されたデータを他のデータベースに自動的に同期できるレプリケーション機能を提供します。

データベースのレプリケーションの概念は、マスターデータベース (マスター) とスレーブデータベース (スレーブ) の 2 つのカテゴリに分類できます。マスターデータベースで書き込み操作が発生し、データが変更されると、スレーブデータベースは自動的にデータを同期します。スレーブデータベースは通常読み取り専用で、マスターデータベースから同期されたデータを受け入れます。マスターデータベースには複数のスレーブデータベースを含めることができます。

Redis レプリケーションはシンプルで使いやすく、スレーブ Redis サーバーまたはマスターサーバーのレプリカを許可するように構成されています。次に、redis レプリケーションには非常に重要な機能がいくつかあります。

マスターは複数のスレーブを持つことができます。

スレーブは他のスレーブに接続でき、同じマスター配下のスレーブからのリンクを受け入れるだけでなく、同じ構造図内の他のスレーブからのリンクも受け入れることができます。

Redis レプリケーションはマスターセグメントでノンブロッキングです。つまり、マスターは同じまたは複数のスレーブで同期を実行するときにもクエリを受け入れることができます。

レプリケーションはスレーブ側でもノンブロッキングです。redis.conf で redis 関数を構成すると、スレーブが新しい同期を実行しているときは、クエリを提供するために古いデータ情報を使用できます。、redis スレーブがマスターとの接続を失ったときに、スレーブがクライアントエラーを送信するように構成できます。

読み取り専用クエリを実行できる複数のスレーブを使用するには、レプリケーションを 2 回または複数回繰り返すことができ、スケーラブルです (例: スレーブの会話と繰り返しの並べ替え操作、データの複数のコピー)は比較的冗長です) 単純です)。

レプリケーションを通じて、マスターのハードディスク全体への書き込みの消費を回避できます。マスターの構成ファイル redis.conf を「保存を避ける」ように設定し (すべての「保存」コマンドをコメントアウト)、接続するだけです。データを永続化するために使用されるサーバー。単なるスレーブです。ただし、マスターが自動的に再起動しないようにする必要があります (詳細は以下を参照してください)

Redis レプリケーション構成

Redis でレプリケーション機能を使用するのは非常に簡単です。「」を追加するだけです。「slaveof」をスレーブデータベースの設定ファイルに追加します。マスターデータレプリケーションマスターデータベースポート」。

メインデータベースには構成は必要ありません。まず、最も単純化されたレプリケーションシステムを見てみましょう。1 台のサーバー上で 2 つの Redis サンプルを開始し、異なるポートでリッスンし、1 つはマスターデータベースとして機能し、もう 1 つはスレーブデータベースとして機能します。

最初に、パラメーターを追加せずに、マスターデータベースとして Redis インスタンスを起動します。

$ redis-server --port 6379 &

ログイン後にコピー

インスタンスは、デフォルトでポート 6379 をリッスンし、次に、slaveof パラメーターを追加して、別の Redis インスタンスをスレーブとして起動します。データベースを起動し、ポート 6380 をリッスンさせます:

$ redis-server --port 6380 --slaveof 127.0.0.1 6379 &

ログイン後にコピー

インスタンスの起動ステータスを確認します:

$ ps aux | grep redis
root      2886  0.0  0.0  38652  4448 pts/0    Sl   16:57   0:00 redis-server *:6379
root      2889  0.0  0.0  36604  4368 pts/0    Sl   16:57   0:00 redis-server *:6380

ログイン後にコピー

この時点で、マスターデータベース内のデータ変更はすべてスレーブに自動的に同期されます。 redis-cli インスタンス A を開いてデータベースに接続します:

$ redis-cli -p 6379

ログイン後にコピー

次に、redis-cli インスタンス B を開いてスレーブデータベースに接続します:

$ redis-cli -p 6380

ログイン後にコピー

この時点では、INFO を使用します。インスタンス A とインスタンス B でそれぞれ取得するコマンドレプリケーションに関する関連情報。

127.0.0.1:6379> INfo replication# Replicationrole:master
connected_slaves:1
slave0:ip=127.0.0.1,port=6380,state=online,offset=266,lag=1
master_repl_offset:266
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:2
repl_backlog_histlen:265

ログイン後にコピー

インスタンス A のロールはマスター (メインデータベース)、接続されているスレーブデータベース (connectd_slaves) の数は 1 であることがわかります。

インスタンス B で取得された同じ応答情報は次のとおりです:

127.0.0.1:6380> INfo replication# Replicationrole:slave
master_host:127.0.0.1
master_port:6379
master_link_status:up
master_last_io_seconds_ago:9
master_sync_in_progress:0
slave_repl_offset:378
slave_priority:100
slave_read_only:1
connected_slaves:0
master_repl_offset:0
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0

ログイン後にコピー

インスタンス B の役割はスレーブ、つまりスレーブデータベースであり、そのメインデータベースのアドレスであることがわかります。は 127.0.0.1 です。ポートは 6379 です。

次に、SET コマンドを使用してインスタンス A のキーの値を設定します:

127.0.0.1:6379> set foo bar
OK

ログイン後にコピー

この時点で、値はインスタンス B で取得できます:

127.0.0.1:6380> get foo"bar"

ログイン後にコピー

Prove Redis インスタンスの 2 つのレプリケーション機能が利用できるようになりました。デフォルトでは、スレーブデータベースは読み取り専用です。スレーブデータベースのデータを直接変更すると、次のようなエラーが発生します:

127.0.0.1:6380> set foo hey
(error) READONLY You can&#39;t write against a read only slave.

ログイン後にコピー

ただし、slave-read-only=no を設定することもできます。スレーブデータベースの構成ファイル。スレーブデータベースを書き込み可能にしますが、スレーブデータベースへの変更は他のデータベースに同期されず、マスターデータベースの勝者データが更新されると、スレーブデータベースの変更も反映されないためです。上書きされるため、このシナリオでは通常は不可能です。見落とされやすい潜在的なアプリケーションロジックエラーを避けるために、スレーブデータベースは書き込み可能に設定する必要があります。

複数のスレーブデータベースの構成には同じ方法が使用されます。同じマスターデータベースを指すようにすべてのスレーブデータベースの構成ファイルに salveof パラメータを追加するだけです。構成ファイルまたはコマンドラインパラメーターを使用してslaveof パラメーターを設定することに加えて、slaveof コマンドを使用して実行時にそれらを変更することもできます。別のインスタンス C (6381) を追加してみましょう:

$ redis-server --port 6381 &
$ redis-cli -p 6381
127.0.0.1:6381> slaveof 127.0.0.1 6379
127.0.0.1:6381> get foo"bar"

ログイン後にコピー

如果该数据库已经是其他主数据库的从数据库了，slaveof命令会停止和原来数据库的同步转而和新数据库同步，此外对于从数据库来说，还可以使用slaveof no one命令来使当前数据库停止接收其他数据库的同步并转换成为主数据库。如下测试，在从库实例C上写入数据时时不允许的，然后使用slaveof no one将此数据库转换为主数据库，然后再写入数据就没有问题了。一般用于但主节点挂掉的时候，立刻把从节点切换为主节点提供数据操作服务。

127.0.0.1:6381> set foo bar
(error) READONLY You can&#39;t write against a read only slave.
127.0.0.1:6381> SLAVEOF no one
5493:M 07 Aug 17:23:06.792 # Connection with master lost.
5493:M 07 Aug 17:23:06.792 * Caching the disconnected master state.
5493:M 07 Aug 17:23:06.792 * Discarding previously cached master state.
5493:M 07 Aug 17:23:06.792 * MASTER MODE enabled (user request from &#39;id=2 addr=127.0.0.1:40825 fd=6 name= age=348 idle=0 flags=N db=0 sub=0 psub=0 multi=-1 qbuf=0 qbuf-free=32768 obl=0 oll=0 omem=0 events=r cmd=slaveof&#39;)
2886:M 07 Aug 17:23:06.792 # Connection with slave 127.0.0.1:6381 lost.
OK
127.0.0.1:6381> set foo bar
OK

ログイン後にコピー

复制常用参数

slaveof

ログイン後にコピー

将当前server做为slave，并为其指定master信息。

masterauth

ログイン後にコピー

以认证的方式连接到master，如果master中使用了”密码保护”，slave必须交付正确的授权密码，才能连接成功。”requirepas”配置项指定了当前server的密码。此配置项中值需要和master机器的”requirepas”保持一致。此参数配置在slave端。

slave-serve-stale-data yes

ログイン後にコピー

如果当前server是slave，那么当slave与master失去通讯时，是否继续为客户端提供服务，”yes”表示继续,”no”表示终止。如果在“yes”的情况下，从节点继续向客户端提供只读服务，数据有可能是过期的。在”no”情况下，任何向此server发送的数据请求服务(包括客户端和此server的slave)都将被告知”error”。

slave-read-only yes

slave是否为”只读”，强烈建议为”yes”。

repl-ping-slave-period 10

slave向指定的master发送ping消息的时间间隔(秒)，默认为10。

repl-timeout 60

slave与master通讯中，最大空闲时间，默认60秒，超时将导致连接关闭。

repl-disable-tcp-nodelay no

slave与master的连接，是否禁用TCP nodelay选项。”yes”表示禁用，那么socket通讯中数据将会以packet方式发送(packet大小受到socket buffer限制)，可以提高socket通讯的效率(tcp交互次数)，但是小数据将会被buffer，不会被立即发送，对于接受者可能存在延迟。”no”表示开启tcp nodelay选项，任何数据都会被立即发送，及时性较好，但是效率较低。建议为”no”。

slave-priority 100

适用Sentinel模块(unstable,M-S集群管理和监控)，需要额外的配置文件支持。slave的权重值，默认100。当master失效后，Sentinel将会从slave列表中找到权重值最低(>0)的slave，并提升为master。如果权重值为0，表示此slave为”观察者”，不参与master选举。

ログイン後にコピー

了解Redis的复制原理

了解Redis复制的原理有助于运维Redis过程中的规划节点和处理节点故障等问题。下面介绍Redis实现复制的工程。 Redis マスター/スレーブテクノロジーの分析例

当一个从数据库启动后，会向主数据库发送SYNC命令，同时主数据库接收到SYNC命令后会开始在后台保存快照（即RDB持久化的过程），并将保存快照期间接收到的命令缓存起来，当快照完成后，Redis Master会将快照文件发送给从数据库，从数据库收到后，会载入快照文件。之后Redis Master会以Redis命令协议的格式，将写命令缓冲区中积累的所有内容都发送给从服务器。以上过程称为复制初始化，复制初始化结束后，主数据库每当收到写命令时就会将命令同步给从数据库，从而保证主从数据库数据一致。

你可以通过telnet命令来亲自验证这个同步过程：首先连上一个正在处理命令请求的Redis服务器，然后向它发送SYNC命令，过一阵子，你将会看到telnet会话接收到服务器发来的大段数据（.rdb文件），之后还会看到，所有的服务器执行过的写命令，都会重新发送到telnet会话来。

当主从数据库之间的连接断开重连后，Redis 2.6以及之前的版本会重新进行复制初始化（即主数据库重新保存快照并传送给从数据库），即使从数据库可以仅有几条命令没有收到，主数据库也必须要将数据库里的所有数据重新传送给从数据库。这使得主从数据库断线重连后的数据恢复过程效率很低下，在网络环境不好的时候这一问题尤其明显，Redis 2.8版本的一个重要改进就是断线重连能够支持有条件的增量数据传输，当从数据库重新连接上主数据库后，主数据库只需要将断线期间执行的命令传送给从数据库，从而大大提高Redis复制的实用性。

增量复制的实现，基于以下3点：

1）从数据库会存储主数据库的运行ID（run id），每个Redis运行实例均会拥有一个唯一的运行ID，每当实例重启后，就会自动生成一个新的运行ID。

2）在复制同步阶段，主数据库每将一个命令传送给从数据库时，都会同时把该命令存放到一个积压队列（backlog）中，并记录下当前积压队列中存放的命令的偏移量范围。

3）同时，从数据库接收到主数据库传来的命令时，会记录下该命令的偏移量。

这三点是实现增量复制的基础，当主从连接准备就绪后，从数据库会发送一条SYNC命令来告诉主数据库可以开始把所有数据同步过来了。而2.8版本之后，不再发送SYNC命令，取而代之的是发送PSYNC，格式为“PSYNC 主数据库的运行ID 断开前最新的命令偏移量”。收到PSYNC命令的主数据库将执行以下检查来确定是否可以进行增量复制。

1）首先主数据库会判断从数据库传送来的运行ID是否和自己的运行ID相同，这一步骤的意义在于确保从数据库之前确实是和自己同步的，以免从数据库拿到错误的数据（如主数据库在断连期间重启过，会造成数据的不一致性）。

2）然后判断从数据库最后同步成功的命令偏移量是否在积压队列中，如果在则可以执行增量复制，并将积压队列中相应的命令发送给从数据库。

如果此次重连不满足增量复制的条件，主数据会进行一次全部同步（即与Redis 2.6的过程相同），大部分情况下，增量复制的过程对开发者来说是完全透明的，开发者不需要关心增量复制的具体细节，2.8版本的主数据库也可以正常地和旧版本的从数据库同步（通过接收SYNC命令），同样2.8版本的从数据库也可以与旧版本的主数据库同步（通过发送SYNC命令），唯一需要开发者设置的就是积压队列的大小了。

积压队列在本质上是一个固定长度的循环队列，默认情况下积压队列的大小为1MB，可以通过配置文件的repl-backlog-size选项来调整。随着积压队列的增大，主从数据库断线的可容忍时间也随之延长，这是比较容易理解的。根据主从数据库之间的网络状态，设置一个合理的积压队列很重要。因为积压队列存储的内容是命令本身，如 SET FOO BAR，所以估算积压队列的大小只需要估计主从数据库断线的时间中主从数据库可能执行的命令的大小即可。与积压队列相关的另一个配置选项是repl-backlog-ttl，即当所有主从数据库与主数据断开连接后，经过多久时间可以释放积压队列的内存空间，默认时间是1小时。

从数据库持久化

另一个相对耗时的操作是持久化，为了提高性能，可以通过复制功能建立一个或多个从数据库，并在从数据库中启用持久化，同时在主数据库禁用持久化，当从数据库崩溃重启后主数据库会自动将时间同步过来，所以无需担心数据丢失。

然后当主数据库崩溃时，情况就稍显复杂了。手工通过从数据库数据恢复主数据库数据时，需要严格按照以下两步进行：

1）在从数据库中使用SLAVEOF NO ONE命令将从数据库提升为主数据库继续服务。

2）启动之前崩溃的主数据库，然后使用SLAVEOF命令将其设置成新的主数据库的从数据库，即可将数据同步回来。

注意，当开启复制且主数据库关闭持久化的时候，一定不要使用supervisor以及类似的进程管理工具令主数据库崩溃后自动重启。同样当主数据库所在的服务器因故关闭时，也要避免直接重新启动。这是因为当主数据库重新启动后，因为没开持久化功能，所以数据库中所有数据都被清空，这时从数据库依然会从主数据库中接收数据，使得所有从数据库也被清空，导致从数据库的持久化失去意义。

无论哪种情况，手工维护从数据库或主数据的重启以及数据恢复都相对麻烦，好在Redis提供了一种自动化方案哨兵来实现这一过程，避免了手工维护的麻烦和容易出错的问题。

无硬盘复制

上面介绍了Redis复制的工作原理时介绍了复制是基于RDB方式的持久化实现的，即主数据库端在后台保存了RDB快照，从数据库端则接收并载入快照文件，这样的实现有点是可以显著地简化逻辑，复用已有的代码，但是缺点也很明显。

1）当主数据库禁用RDB快照时（即删除了所有的配置文件中的save语句），如果执行了复制初始化操作，Redis依然会生成RDB快照，所以下次启动后主数据库会以该快照恢复数据。恢复的数据可能对应于任何时间点，因为无法确定复制发生的确切时间。

这个过程会对性能产生影响，因为复制初始化需要在硬盘中生成RDB快照文件，如果硬盘性能较慢。举例来说，当使用Redis做缓存系统时，因为不需要持久化，所以服务器的硬盘读写速度可能较差。但是当该缓存系统使用一主多从的集群架构时，每次和从数据库同步，Redis都会执行一次快照，同时对硬盘进行读写，导致性能下降。

因此从2.8.18版本开始，Redis引入了无硬盘复制选项，开启该选项时，Redis在与从数据库进行复制初始化时将不会将快照内容存储到硬盘上，而是直接通过网络发送给从数据库，避免了硬盘的性能瓶颈。可以在配置文件中使用如下配置来开启该功能：