缓存雪崩
数据未加载到缓存中,或者缓存同一时间大面积的失效,从而导致所有请求都去查数据库,导致数据库CPU和内存负载过高,甚至宕机。
比如一个雪崩的简单过程:
Redis 集群大面积故障
缓存失效,仍然有大量请求访问缓存服务 Redis
Redis 大量失效后,大量请求转向 Mysql 数据库
Mysql 的调用量暴增,很快就用满了 CPU, 甚至直接宕机
由于大量的应用服务依赖于 mysql 和 redis 的服务,这时候就很快演变成各服务器集群的雪崩,最后导致网站彻底崩溃
如何预防缓存雪崩
缓存的高可用性
缓存层设计成高可用,防止缓存大面积故障。即使个别节点,个别机器,甚至机房宕掉,依然可以提供服务,例如 Redis Sentinel 哨兵模式 和 Redis Cluster 集群 都实现了高可用。
缓存降级
可以利用 ehcache 等本地缓存(暂时支持服务), 但主要还是对原服务访问进行限流,资源隔离(熔断)、降级等。
当访问量剧增,服务出现问题仍然需要保证服务还是可用的。系统可以根据一些关键数据进行自动降级,也可以配置实现人工降级,这里会涉及到运营的配合。
降级的最终目的是保证核心服务的可用,即使是有损的
在进行降级之前要对系统进行梳理,比如:哪些业务是核心(必须保证),哪些业务可以容许暂时不提供服务(利用静态页面替换)等,以及配合服务器核心指标,来后设置整体预案,比如:
一般:比如有些服务偶尔因为网络抖动或者服务正在上线而超时,可以自动降级;
警告:有些服务在一段时间内成功率有波动(如在95~100%之间),可以自动降级或人工降级,并发送告警;
错误:比如可用率低于90%,或者数据库连接池被打爆了,或者访问量突然猛增到系统能承受的最大阀值,此时可以根据情况自动降级或者人工降级;
严重错误:比如因为特殊原因数据错误了,此时需要紧急人工降级。
Redis 备份 和 快速预热
Redis数据备份和恢复
快速缓存预热
提前演练
最后,建议还是在项目上线前,演练缓存层宕掉后,应用以及后端的负载情况以及可能出现的问题,对高可用提前预演,提前发现问题。
缓存穿透:是指查询一个一不存在的数据。例如:从缓存redis没有命中,需要从mysql数据库查询,查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到数据库去查询,造成缓存穿透。
解决思路:
1. 常见的解决方法 “布隆过滤器”,将所有可能存在的数据 哈希 到一个足够大的 bitmap 中,一个不存在的数据会被 bitmap 拦截掉,从而避免对DB查询的压力。
2. 简单粗暴的方法:如果查询结果为空,将空值key 进行缓存,设置过期时间很短,最长不超过5分钟。
缓存击穿:key 对应数据存在,但是在redis 中过期,此时有大量并发请求来时,会先从DB加载数据并设置缓存,并发量大时可能瞬间压垮 DB。
解决思路:
使用互斥锁(mutex key),简单说:在缓存失效的时候判断(key)对应值是否为空,为空时,不是立即去 DB 查询,而是先使用缓存工具的带成功操作的返回值(Redis SetNx),去 set 一个 mutex key, 当操作返回成功后,在进行 Load DB 的操作并设置缓存
SETNX,是「SET if not exists」的缩写,也就是只有不存在的时候才设置,可以利用它来实现锁的效果。
缓存并发:这里的并发指的是多个redis的client同时set key引起的并发问题。其实redis自身就是单线程操作,多个client并发操作,按照先到先执行的原则,先到的先执行,其余的阻塞。当然,另外的解决方案是把redis.set操作放在队列中使其串行化,必须的一个一个执行。
缓存预热:缓存预热就是系统上线后,将相关的缓存数据直接加载到缓存系统。这样就可以避免在用户请求的时候,先查询数据库,然后再将数据缓存的问题!用户直接查询事先被预热的缓存数据!
解决思路:
1、直接写个缓存刷新页面,上线时手工操作下;
2、数据量不大,可以在项目启动的时候自动进行加载;
目的就是在系统上线前,将数据加载到缓存中。
参考链接:https://zhuanlan.zhihu.com/p/58331707
转载请注明出处~~~~