首页 数据库 Redis Redis哨兵原理,我忍你很久了!

Redis哨兵原理,我忍你很久了!

Aug 28, 2020 pm 05:22 PM
redis

redis主从复制的作用中有这么一句话“主从复制是高可用的基石”,那什么是高可用呢!高可用就是减少系统不能提供的时间,也就是常听到的以6个9为基准。实现高可用必不可少的就是哨兵和集群。本文主要介绍哨兵机制。

前言

咔咔整理了一个路线图,打造一份面试宝典,准备按照这样的路线图进行编写文章,后期发现没有补充到的知识点在进行添加。也期待各位伙伴一起来帮助补充一下。评论区见哦!

在这里插入图片描述
在这里插入图片描述

本文主要围绕如下几个方面介绍哨兵

  • 哨兵介绍
  • 哨兵配置
  • 哨兵工作原理

本文实现环境

  • centos7.3 redis4.0
  • redis工作目录  /usr/local/redis
  • 在虚拟机进行模拟操作

一、什么是哨兵

先简单说几句我们在配置主从复制时有一种情况就是主节点宕机了,谁来提供服务呢!

当主节点宕机后主从复制就没有存在的意义了,数据为王的时代没有了数据何谈什么高可用。

在这里插入图片描述这个时候就横空出世了一位老大哥名叫哨兵,老大哥说这个问题我来帮你们处理。

既然主节点master作为老大不领你们玩了。我就从你们四个中间再挑选出来一位老大,然后你们跟着他玩。

等不带你们玩的那个老大回来后他的身份就失效了,就不在是你们的老大了。他只能跟着我挑选出来的老大玩。

上边这段对话过程就是我们配置哨兵的意义到底在哪,跟谁玩就是谁给谁数据,知道了哨兵的作用我们就在继续。

「最后我们用专业术语来解释一下什么是哨兵。」

哨兵,英文名sentinel,是一个分布式系统,用于对主从结构中的每一台服务器进行监控,当主节点出现故障后通过投票机制来挑选新的主节点,并且将所有的从节点连接到新的主节点上。

二、哨兵的作用

上文中我们谈到的对话过程就是哨兵的作用之一自动故障转移。

谈到作用肯定就是这个哨兵到底在工作中到底干了什么事情。我们先用比较干巴的概念描述一下,然后在下文的工作原理会一一谈到。

哨兵的三个作用监控、通知、自动转移故障

  • 监控
    • 监控谁?支持主从结构的工作一个是主节点一个是从节点,那肯定就是监控这俩个了。
    • 监控主节点和从节点是否正常运行
    • 检测主节点是否存活,主节点和从节点运行情况
  • 通知
    • 哨兵检测的服务器出现问题时,会向其他的哨兵发送通知,哨兵之间就相当于一个微信群,每个哨兵发现的问题都会发在这个群里。
  • 自动故障转移
    • 当检测到主节点宕机后,断开与宕机主节点连接的所有从节点,在从节点中选取一个作为主节点,然后将其他的从节点连接到这个最新主节点的上。并且告知客户端最新的服务器地址。

这里有一个注意点,哨兵也是一台redis服务器,只是不对外提供任何服务。

配置哨兵时配置为单数。那么为什么配置哨兵服务器的数量为单数呢?带着这个疑问你会在下文看到你想要的答案。

二、如何配置哨兵

1. 准备工作

这一章我们就开始配置哨兵,前期工作准备。下图就是咔咔的准备工作。开启8个客户端,三个哨兵、一个主节点、俩个从节点、一个主节点客户端、一个从节点客户端。在这里插入图片描述

2. sentinel.conf配置解读

哨兵使用的配置文件是sentinel.conf在这里插入图片描述我们来对sentinel.conf配置信息进行解读在这里插入图片描述但是大多数都是注释,这里咔咔给大家提供一个命令来过滤这些无用信息 cat sentinel.conf | grep -v '#' | grep -v '^$'在这里插入图片描述

  • port 26379 :对外服务端口号
  • dir /tmp:存储哨兵的工作信息
  • sentinel monitor mymaster 127.0.0.1 6379 2:监控的是谁,名字可以自定义,后边的2代表的是,如果有俩个哨兵判断这个主节点挂了那这个主节点就挂了,通常设置为哨兵个数一半加一。
  • sentinel down-after-milliseconds mymaster 30000:哨兵连接主节点多长时间没有响应就代表挂了。后边30000是毫秒,也就是30秒。
  • sentinel parallel-syncs mymaster 1:这个配置项是指在故障转移时,最多有多少个从节点对新的主节点进行同步。这个值越小完成故障转移的时间就越长,这个值越大就意味着越 多的从节点因为同步数据而不可用。
  • sentinel failover-timeout mymaster 180000:在进行同步的过程中,多长时间完成算有效,系统默认值是3分钟。

3. 开始配置

使用命令cat sentinel.conf | grep -v '#' | grep -v '^$' > ./data/sentinel-26379.conf把sentinel.conf过滤后的信息移到/usr/local/redis/conf在这里插入图片描述然后打开sentinel-26379.conf修改信息存放目录在这里插入图片描述然后快速的复制俩个哨兵配置文件,端口为26380和26381。sed 's/26379/26381/g' sentinel-26379.conf > sentinel-26381.conf

在这里插入图片描述
在这里插入图片描述

测试主从复制处于正常工作状态,启动三台redis服务器,端口分别为6379、6380、6381在这里插入图片描述查看主节点信息,是有俩台从节点在连接着,端口分别为6380、6381。

这里有一个小小的点就是lag怎么一个是1一个是0呢!lag是延迟时间,我这里是本地测试所以会出现0的情况,使用云服务器是很少出现的。lag的值为0和1都属于正常。在这里插入图片描述测试主节点添加一个hash值,hset kaka name kaka在这里插入图片描述分别从slave1和slave2获取kaka的值,检测主从复制是否正常运行。

经过测试我们的主从结构是正常运行的。在这里插入图片描述在这里插入图片描述启动一个哨兵redis-sentinel 26379-sentinel.conf在这里插入图片描述连接26379哨兵,主要是最后一行,监控的主节点名为mymaster,状态正常,从节点有俩个,哨兵数量为1个在这里插入图片描述在来查看一下26379的哨兵配置信息,这个时候已经改动了在这里插入图片描述在启动一个26380的哨兵,redis-sentinel 26380-sentinel.conf,这里注意一下最后一行多了一条信息,这个id就是我们26379配置文件新增的id在这里插入图片描述然后我们来到哨兵26379的客户端,同样也是新增的26380哨兵的id在这里插入图片描述这个时候我们在查看一下26379哨兵的配置文件,第一次查看配置文件是没有配置26380哨兵的,第二次查看时配置了26380哨兵后添加的信息。在这里插入图片描述最后我们需要把哨兵客户端3启动起来,端口号为26381。启动起来之后,我们的配置信息和服务端的信息也会改动,添加哨兵26380有的信息,哨兵26381也会有。

直到这里我们对哨兵的配置就结束了,接下来我们把主节点master给宕掉在这里插入图片描述等待30秒后我们来到26379哨兵的客户端,这里新增了一些信息,那么这些信息都做了什么呢!让我们细细道来。

在这里插入图片描述这里边的信息我们先需要知道几个

  • +sdown :这个信息后是指三个哨兵里边有一个认为主节点宕机了
  • +odown:这个信息是指其他俩个哨兵去连接了一下主节点,发现确实是主节点宕机了
  • 然后发起了一轮投票,这里咔咔使用的是redis4.0,版本之间这块信息有点差异
  • +switch-master mymaster 127.0.0.1 6379 127.0.0.1 6380:直到这里是哨兵发起投票的结果,推选端口为6380的redis为主节点
  • +slave slave 127.0.0.1:6381 127.0.0.1 6381 @ mymaster 127.0.0.1 6380:这里就把端口为6381与6379和新的主节点6380做了一个连接
  • +sdown slave 127.0.0.1:6379 127.0.0.1 6379 @ mymaster 127.0.0.1 6380:最后一句是端口为6379的还是没有上线,于是给踢下线

当我们在重新把6379的redis服务器上线后,就可以看到哨兵服务端响应了俩句。一句是去除6379的下线。最后一句就是重连6379到新的主节点上。在这里插入图片描述在这里插入图片描述这个时候主节点就是6380了,在6380的redis客户端设置值,检测主从复制是否正常工作。

在新的主节点6380添加list类型在这里插入图片描述在6379和6381获取这个值,至此呢!我们的哨兵模式就配置完成了。在这里插入图片描述在这里插入图片描述

三、哨兵工作原理

配置完哨兵后,就需要对其工作原理进行解析了,只有知道其工作流程,才能对哨兵有更好的理解。

本文讲解原理没有那么干巴!让你可以把一篇技术文章当故事去看。

进入正题,哨兵作用是监控、通知、故障转移。那么工作原理也是围绕这三点来讲的。

1. 监控工作流程

在这里插入图片描述
在这里插入图片描述
  1. 哨兵发送info指令,并且保存所有哨兵状态,主节点和从节点的信息
  2. 主节点会记录redis实例的信息,主节点记录的信息跟哨兵记录的信息看起来是一样的,实际上还是有点区别哈。
  3. 哨兵会根据在主节点拿到的从节点信息,给对应的从节点也发送info指令
  4. 接着哨兵2来了,同样的也会改主节点发送info指令,并且建立cmd连接
  5. 这个时候哨兵2也会保存跟哨兵1一样的信息,只不过是保存的哨兵信息是2个。
  6. 这个时候为了每个哨兵的信息都一致它们之间建立了一个发布订阅。为了哨兵之间的信息长期对称它们之间也会互发ping命令。
  7. 当再来一个哨兵3时,也会做同样的事情,给主节点和从节点发送info。并且跟哨兵1和哨兵2建立连接。

2. 通知工作流程

Sentinel会给主从的所有节点发送命令获取其状态,并且会把信息发布到哨兵的订阅里。在这里插入图片描述

3. 故障转移原理(本文重点)

在这里插入图片描述
在这里插入图片描述
  • 哨兵会一直给主节点发送publish sentinel :hello,直到哨兵报出sdown,这个词这会是有不是有点熟悉了。没错就是我们上文中把主节点断开后哨兵服务端报出的信息。哨兵报出主节点sdown后还没有完,哨兵还会往内网里发布消息说明这个主节点挂了。发送的指令是sentinel is-master-down-by-address-port
  • 其余的哨兵接收到指令后,主节点挂了吗?让我去看看到底挂没挂。发送的信息也是hello。其余的哨兵也会发送他们收到的信息并且发送指令sentinel is-master-down-by-address-port到自己的内网,确认一下第一个发送sentinel is-master-down-by-address-port的哨兵说你说的对,这个家伙确实挂了。当所有人都认为主节点挂了后就会修改其状态为odown。当一个哨兵认为主节点挂了标记的是sdown,当半数哨兵都认为挂了其标记的状态是odown。这也就是配置哨兵为什么配置单数的原因。
  • 对于一个哨兵认为主节点挂了称之为主观下线,半数哨兵认为主节点挂了称之为客官下线。
  • 一旦被认为主节点客官下线后,哨兵就会进行下一步操作

这时哨兵已经检测到问题所在了,那么到底是那个哨兵去负责推选新的主节点呢!不能是张三也去,李四也去,王五也去,这样就乱套了、于是就需要在所有的哨兵里选出领头的,那么是如何选的呢!请看下图。

这个时候呢!五个sentinel就在一起开会了,所有的哨兵都在一个内网中,然后他们会做一件事情就是五个sentinel会同时发送指令sentinel is-master-down-by-address-port并且携带上自己竞选次数和runid。在这里插入图片描述每个sentinel既是参选者也是投票者,每个sentinel都有一票,信封就代表自己的投票权。在这里插入图片描述当sentinel1和sentinel4同时把指令发送到群里准备竞选时,sentinel2这个时候就说我先接到谁的指令就把票投给谁。假如sentinel1发的早,那么sentinel2的票就会投给sentinel1。在这里插入图片描述按照这样的规则一直发起投票直到有一个sentinel的票数为总sentinel数量的一半之多。假设说是sentinel1的票数满足总哨兵数量的一半之多后,sentinel1就会当选。这个时候就进行到了下一个阶段。在这里插入图片描述在上边哨兵已经选出了sentinel1为代表去所有的从节点找出一个作为主节点。这个挑选主节点不是随便拿一个是有一定的规则的。

先把不在线的干掉

在这里插入图片描述响应慢的干掉,sentinel会给所有的redis发送信息,响应速度慢的就会被干掉在这里插入图片描述与原主节点断开时间最久的干掉,这里由于演示不够用了,所有新增了一个slave5,没有任何意义哈!在这里插入图片描述以上三个点都判断结束后还有salve4和slave5,就会根据优先原则来进行筛选。

  • 首先会根据优先级,如果优先级一样在进行其他判断
  • 判断offset偏移量,判断数据同步性,假如说slave4的offset为90  slave5偏移量为100  那么哨兵就会认为slave4的网络是不是有问题啊!于是就会选slave5为新的主节点。那如果说是slave4和slave5的offset相同呢!还有最后一个判断
  • 最后一步就是判断runid了,也就是职场中的论资排辈了,也就说根据runid的创建时间来判断,时间早的上位。

在这里插入图片描述选出新的主节点后就要对所有的节点发送指令了。在这里插入图片描述

四、总结

关于哨兵的所有知识点就已经说完了,本文最重要的就是哨兵的工作原理了。我们在简单的梳理一下其工作原理。

  • 首先进行监控,并且所有的哨兵同步信息

  • 哨兵向订阅里边发布信息

  • 故障转移

    • 哨兵发现主节点下线
    • 哨兵开启投票竞选负责人
    • 由负责人推选新的主节点
    • 新的主节点断开原主节点,并且其他的从节点连接新的主节点,原主节点上线后作为从节点连接。

以上就是咔咔对哨兵的理解,如果错误可以提出,咔咔及时改正。

坚持学习、坚持写博、坚持分享是咔咔从业以来一直所秉持的信念。希望在偌大互联网中咔咔的文章能带给你一丝丝帮助。我们下期再见。

推荐:《Redis教程

以上是Redis哨兵原理,我忍你很久了!的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌
威尔R.E.P.O.有交叉游戏吗?
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

redis集群模式怎么搭建 redis集群模式怎么搭建 Apr 10, 2025 pm 10:15 PM

Redis集群模式通过分片将Redis实例部署到多个服务器,提高可扩展性和可用性。搭建步骤如下:创建奇数个Redis实例,端口不同;创建3个sentinel实例,监控Redis实例并进行故障转移;配置sentinel配置文件,添加监控Redis实例信息和故障转移设置;配置Redis实例配置文件,启用集群模式并指定集群信息文件路径;创建nodes.conf文件,包含各Redis实例的信息;启动集群,执行create命令创建集群并指定副本数量;登录集群执行CLUSTER INFO命令验证集群状态;使

redis数据怎么清空 redis数据怎么清空 Apr 10, 2025 pm 10:06 PM

如何清空 Redis 数据:使用 FLUSHALL 命令清除所有键值。使用 FLUSHDB 命令清除当前选定数据库的键值。使用 SELECT 切换数据库,再使用 FLUSHDB 清除多个数据库。使用 DEL 命令删除特定键。使用 redis-cli 工具清空数据。

redis指令怎么用 redis指令怎么用 Apr 10, 2025 pm 08:45 PM

使用 Redis 指令需要以下步骤:打开 Redis 客户端。输入指令(动词 键 值)。提供所需参数(因指令而异)。按 Enter 执行指令。Redis 返回响应,指示操作结果(通常为 OK 或 -ERR)。

redis怎么使用锁 redis怎么使用锁 Apr 10, 2025 pm 08:39 PM

使用Redis进行锁操作需要通过SETNX命令获取锁,然后使用EXPIRE命令设置过期时间。具体步骤为:(1) 使用SETNX命令尝试设置一个键值对;(2) 使用EXPIRE命令为锁设置过期时间;(3) 当不再需要锁时,使用DEL命令删除该锁。

redis怎么读取队列 redis怎么读取队列 Apr 10, 2025 pm 10:12 PM

要从 Redis 读取队列,需要获取队列名称、使用 LPOP 命令读取元素,并处理空队列。具体步骤如下:获取队列名称:以 "queue:" 前缀命名,如 "queue:my-queue"。使用 LPOP 命令:从队列头部弹出元素并返回其值,如 LPOP queue:my-queue。处理空队列:如果队列为空,LPOP 返回 nil,可先检查队列是否存在再读取元素。

redis底层怎么实现 redis底层怎么实现 Apr 10, 2025 pm 07:21 PM

Redis 使用哈希表存储数据,支持字符串、列表、哈希表、集合和有序集合等数据结构。Redis 通过快照 (RDB) 和追加只写 (AOF) 机制持久化数据。Redis 使用主从复制来提高数据可用性。Redis 使用单线程事件循环处理连接和命令,保证数据原子性和一致性。Redis 为键设置过期时间,并使用 lazy 删除机制删除过期键。

redis怎么读源码 redis怎么读源码 Apr 10, 2025 pm 08:27 PM

理解 Redis 源码的最佳方法是逐步进行:熟悉 Redis 基础知识。选择一个特定的模块或功能作为起点。从模块或功能的入口点开始,逐行查看代码。通过函数调用链查看代码。熟悉 Redis 使用的底层数据结构。识别 Redis 使用的算法。

redis怎么做消息中间件 redis怎么做消息中间件 Apr 10, 2025 pm 07:51 PM

Redis 作为消息中间件,支持生产-消费模型,可持久化消息并保证可靠交付。使用 Redis 作为消息中间件可实现低延迟、可靠和可扩展的消息传递。

See all articles