缓存击穿、缓存穿透、缓存雪崩

news/2025/2/27 8:23:25

在高并发、高流量的分布式系统中,缓存作为优化性能的利器,能够有效减少数据库压力,提高响应速度。然而,在实际使用过程中,缓存的使用并不是一帆风顺的,开发者在设计缓存系统时常常会遇到一些难题,最典型的就是缓存击穿、缓存穿透与缓存雪崩这三大问题。理解并解决这些问题是确保缓存系统稳定高效运行的关键。

本文更倾向于说明这三种情况的概念,目的是为了让大家对于这个情况有了解,如果想要了解更多,可以去看看更多的博客。


一、缓存击穿(Cache Breakdown)

定义

缓存击穿是指某个缓存中的数据在高并发访问的情况下失效(过期或被删除),并且这段时间内,缓存没有及时加载到新的数据,导致请求直接穿透缓存,去访问底层数据库。由于多个请求同时访问数据库,可能导致数据库压力激增,系统性能受到影响。

通俗点来说就是,某个热点数据过期,此时大量用户进行访问,缓存中并没有该数据,大量访问就会访问数据库,就可能导致数据库瘫痪。

原因

缓存失效时间集中:如果多个缓存数据的过期时间非常接近或一致,导致缓存过期时大批量的请求同时访问数据库。
缓存加载延迟:当缓存失效后,数据库的加载速度不足以应对大量请求,造成数据库负载过高。

解决方案

合理设置缓存过期时间:
避免设置相同的过期时间,可以将不同数据的过期时间设置成不同的值,或者给缓存设置一个随机的过期时间。这样可以避免所有缓存同时失效,减少数据库压力。
加锁机制:
缓存失效时,采用加锁机制,确保只有一个请求会去加载数据库数据并更新缓存,其他请求会等待。常见的加锁方式是使用分布式锁或乐观锁。
缓存机制:
采用主备缓存设计,在主缓存失效时,备用缓存可以继续提供服务,减少请求对数据库的压力。

二、缓存穿透(Cache Penetration)


定义


缓存穿透是指请求的数据既不在缓存中,也不存在于数据库中。此时,缓存系统无法命中缓存,且数据库查询也无法找到该数据,导致每一次请求都直接穿透缓存访问数据库。这种情况会导致大量无效请求访问数据库,造成数据库的额外压力。

这种情况有可能会发生在黑客恶意攻击,大量访问并不存在的数据,这些访问的数据不存在于缓存中,导致访问到数据库上。

原因

无效请求:非法请求或查询的数据本身不存在(例如请求一个错误的ID或不存在的数据)。
缓存设计不当:缓存未存储不存在的数据的“空值”,每次查询都会穿透缓存,直接查询数据库。

解决方案

缓存空数据:
对于不存在的数据,可以在缓存中存储一个“空值”标识。当数据库查询返回空数据时,缓存存储该空标识。这样后续相同的请求会直接从缓存中返回空值,而不会再查询数据库。
布隆过滤器(Bloom Filter):
使用布隆过滤器判断请求的数据是否存在。如果请求的数据不存在于布隆过滤器中,则可以直接返回,避免无谓的数据库查询。布隆过滤器具有空间效率高、查询速度快的特点,适用于大规模数据量的判断。
前端和API层校验:
在前端和后端做好数据校验,避免不合法的请求直接进入系统。通过规范化输入数据,可以减少无效的请求对数据库的压力。

三、缓存雪崩(Cache Avalanche)


定义


缓存雪崩是指大量缓存数据在同一时刻过期,导致大批量请求同时访问数据库,造成数据库瞬间承受巨大的压力,甚至可能导致数据库崩溃。缓存雪崩通常发生在缓存过期时间集中或缓存系统故障的情况下。

缓存雪崩可以理解成,大量数据同一时间过期,导致大量请求访问到数据库上,导致数据库瘫痪。


原因

缓存过期时间集中:如果多个缓存数据的过期时间设定得相同,或者大量缓存数据在某个特定时刻过期,就会导致大量请求集中涌向数据库,给数据库带来巨大的压力。
缓存系统故障:当缓存系统出现故障或无法访问时,所有请求都直接访问数据库,极大增加了数据库的负担。

解决方案

设置过期时间的随机性:
缓存数据的过期时间进行随机化配置,避免大量缓存同时失效。比如,在缓存过期时间上增加一个随机的偏移量,使得不同的缓存数据过期时间不再集中在同一时刻。
缓存机制:
通过设置主备缓存,避免在主缓存失效时,所有请求都直接穿透到数据库。备用缓存可以在主缓存失效时继续提供数据,减少数据库的压力。
预热缓存
在系统启动时,可以提前加载一些热点数据到缓存中,防止系统启动时缓存为空,直接访问数据库。同时,定期预热缓存,确保热数据始终存在于缓存中,减少对数据库的访问。
限流与降级:
在高并发时,通过限流或降级策略对数据库请求进行限制。比如,当数据库压力过大时,可以通过降级服务来减轻数据库的负担,或者限制一些非关键请求。

四、总结


缓存是提高系统性能的强大工具,但若不当使用,容易引发缓存击穿、缓存穿透和缓存雪崩等问题。要有效避免这些问题,我们需要从缓存的设计、更新策略、过期时间设置等多个方面入手,采取合理的优化措施。

缓存击穿:通过设置合理的过期时间、加锁机制和双缓存技术来避免。
缓存穿透:通过缓存空数据、布隆过滤器和前端校验来防止。
缓存雪崩:通过设置过期时间随机性、双缓存机制、预热缓存和限流降级等方式来避免。

通过深入理解这些问题并采取相应的解决措施,可以确保缓存系统的稳定性和高效性,从而提升整个系统的性能和可扩展性。


http://www.niftyadmin.cn/n/5869793.html

相关文章

SCIKIT-LEARN 决策树实现csv文档简单的推论预测

一.学习背景 原文来自scikit-learn的学习拓展,根据樱花分类示例衍生而来。源文开源地址:scikit-learn: machine learning in Python — scikit-learn 0.16.1 documentation,想学机器学习和数据挖掘的可以去瞧瞧! 二.读取csv文档 …

Java高频面试之SE-23

hello啊,各位观众姥爷们!!!本baby今天又来了!哈哈哈哈哈嗝🐶 Java 中的 Stream 是 Java 8 引入的一种全新的数据处理方式,它基于函数式编程思想,提供了一种高效、简洁且灵活的方式来…

Spark内存迭代计算

一、宽窄依赖 窄依赖:父RDD的一个分区数据全部发往子RDD的一个分区 宽依赖:父RDD的一个分区数据发往子RDD的多个分区,也称为shuffle 二、Spark是如何进行内存计算的?DAG的作用?Stage阶段划分的作用? &a…

WSL2下,向github进行push时出现timeout的问题

昨晚在完成15445 Project2.2后,笔者兴致冲冲地准备把代码提交到github上,谁知一连提交几次都出现 ssh:connect to host github.com port 22: Connection timed out 这个问题。我开始还以为是网络波动,测试了多次之后才发现应该是22端口出问题…

Linux:(3)

一:Linux和Linux互传(压缩包) scp:Linux scp 命令用于 Linux 之间复制文件和目录。 scp 是 secure copy 的缩写, scp 是 linux 系统下基于 ssh 登陆进行安全的远程文件拷贝命令。 scp 是加密的,rcp 是不加密的,scp 是…

【图形学入门笔记】线性代数的本质

【笔记未完待续】如果我的分享对你有帮助,请记得点赞关注不迷路。 视频源地址:https://www.youtube.com/watch?vfNk_zzaMoSs 作者:3Blue1Brown 此处仅做个人笔记使用。 01 - 向量究竟是什么? 线性代数中最基础、最根源的…

Tomcat 目录结构和应用实现

Tomcat 是一款开源的、轻量级的 Web 服务器,它不仅能够提供 HTTP 服务,还能够运行 Java Servlet 和 JavaServer Pages(JSP)。对于许多开发者来说,理解 Tomcat 的目录结构以及如何在该结构中组织应用,往往是…

解决Deepseek“服务器繁忙,请稍后再试”问题,基于硅基流动和chatbox的解决方案

文章目录 前言操作步骤步骤1:注册账号步骤2:在线体验步骤3:获取API密钥步骤4:安装chatbox步骤5:chatbox设置 价格方面 前言 最近在使用DeepSeek时,开启深度思考功能后,频繁遇到“服务器繁忙&am…