Redis BloomFilter布隆过滤器如何实现-Redis-PHP中文网

Bloom Filter 概念

Bloom Filter 原理

缓存穿透

Bloom Filter的缺点

常见问题

go语言实现

首页

数据库

Redis

Redis BloomFilter布隆过滤器如何实现

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 30, 2023 pm 01:41 PM

redis bloomfilter

Bloom Filter 概念

一个名叫布隆的人在1970年提出了布隆过滤器（英文名：Bloom Filter）。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法，缺点是有一定的误识别率和删除困难。

Bloom Filter 原理

布隆过滤器的原理是，当一个元素被加入集合时，通过K个散列函数将这个元素映射成一个位数组中的K个点，把它们置为1。检索时，我们只要看看这些点是不是都是1就（大约）知道集合中有没有它了：如果这些点有任何一个0，则被检元素一定不在；如果都是1，则被检元素很可能在。这就是布隆过滤器的基本思想。

Bloom Filter跟单哈希函数Bit-Map不同之处在于：Bloom Filter使用了k个哈希函数，每个字符串跟k个bit对应。从而降低了冲突的概率

Redis BloomFilter布隆过滤器如何实现

缓存穿透

Redis BloomFilter布隆过滤器如何实现

每次查询都会直接打到DB

简而言之，言而简之就是我们先把我们数据库的数据都加载到我们的过滤器中，比如数据库的id现在有：1、2、3

那就用id：1 为例子他在上图中经过三次hash之后，把三次原本值0的地方改为1

下次数据进来查询的时候如果id的值是1，那么我就把1拿去三次hash 发现三次hash的值，跟上面的三个位置完全一样，那就能证明过滤器中有1的

反之如果不一样就说明不存在了

那应用的场景在哪里呢？一般我们都会用来防止缓存击穿

简单来说就是你数据库的id都是1开始然后自增的，那我知道你接口是通过id查询的，我就拿负数去查询，这个时候，会发现缓存里面没这个数据，我又去数据库查也没有，一个请求这样，100个，1000个，10000个呢？你的DB基本上就扛不住了，如果在缓存里面加上这个，是不是就不存在了，你判断没这个数据就不去查了，直接return一个数据为空不就好了嘛。

这玩意这么好使那有啥缺点么？有的，我们接着往下看

Bloom Filter的缺点

bloom filter之所以能做到在时间和空间上的效率比较高，是因为牺牲了判断的准确率、删除的便利性

尽管容器可能不包含应查找的元素，但由于哈希操作，这些元素在 k 个哈希位置的值都为 1，所以可能会导致误判。通过建立一个白名单来存储可能会误判的元素，当Bloom Filter中存储的是黑名单时，可以降低误判率。

删除困难。一个放入容器的元素映射到bit数组的k个位置上是1，删除的时候不能简单的直接置为0，可能会影响其他元素的判断。可以采用Counting Bloom Filter

常见问题

1、为何要使用多个哈希函数？

如果只使用一个哈希函数，Hash本身就会经常发生冲突。例如长度100的数组，如果只使用一个哈希函数，添加一个元素后，添加第二个元素时冲突的概率为1%，添加第三个元素时冲突的概率为2%…但如果使用两个哈希函数，添加一个元素后，添加第二个元素时冲突的概率降为万分之4（四种可能的冲突情况，情况总数100x100）

go语言实现

package main
import (
	"fmt"
	"github.com/bits-and-blooms/bitset"
)
//设置哈希数组默认大小为16
const DefaultSize = 16
//设置种子，保证不同哈希函数有不同的计算方式
var seeds = []uint{7, 11, 13, 31, 37, 61}
//布隆过滤器结构，包括二进制数组和多个哈希函数
type BloomFilter struct {
	//使用第三方库
	set *bitset.BitSet
	//指定长度为6
	hashFuncs [6]func(seed uint, value string) uint
}
//构造一个布隆过滤器，包括数组和哈希函数的初始化
func NewBloomFilter() *BloomFilter {
	bf := new(BloomFilter)
	bf.set = bitset.New(DefaultSize)

	for i := 0; i < len(bf.hashFuncs); i++ {
		bf.hashFuncs[i] = createHash()
	}
	return bf
}
//构造6个哈希函数，每个哈希函数有参数seed保证计算方式的不同
func createHash() func(seed uint, value string) uint {
	return func(seed uint, value string) uint {
		var result uint = 0
		for i := 0; i < len(value); i++ {
			result = result*seed + uint(value[i])
		}
		//length = 2^n 时，X % length = X & (length - 1)
		return result & (DefaultSize - 1)
	}
}
//添加元素
func (b *BloomFilter) add(value string) {
	for i, f := range b.hashFuncs {
		//将哈希函数计算结果对应的数组位置1
		b.set.Set(f(seeds[i], value))
	}
}
//判断元素是否存在
func (b *BloomFilter) contains(value string) bool {
	//调用每个哈希函数，并且判断数组对应位是否为1
	//如果不为1，直接返回false，表明一定不存在
	for i, f := range b.hashFuncs {
		//result = result && b.set.Test(f(seeds[i], value))
		if !b.set.Test(f(seeds[i], value)) {
			return false
		}
	}
	return true
}
func main() {
	filter := NewBloomFilter()
	filter.add("asd")
	fmt.Println(filter.contains("asd"))
	fmt.Println(filter.contains("2222"))
	fmt.Println(filter.contains("155343"))
}

登录后复制

输出结果如下：

true
false
false

以上是Redis BloomFilter布隆过滤器如何实现的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7467

CakePHP 教程

1376

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

redis集群模式怎么搭建 Apr 10, 2025 pm 10:15 PM

Redis集群模式通过分片将Redis实例部署到多个服务器，提高可扩展性和可用性。搭建步骤如下：创建奇数个Redis实例，端口不同；创建3个sentinel实例，监控Redis实例并进行故障转移；配置sentinel配置文件，添加监控Redis实例信息和故障转移设置；配置Redis实例配置文件，启用集群模式并指定集群信息文件路径；创建nodes.conf文件，包含各Redis实例的信息；启动集群，执行create命令创建集群并指定副本数量；登录集群执行CLUSTER INFO命令验证集群状态；使

redis底层怎么实现 Apr 10, 2025 pm 07:21 PM

Redis 使用哈希表存储数据，支持字符串、列表、哈希表、集合和有序集合等数据结构。Redis 通过快照 (RDB) 和追加只写 (AOF) 机制持久化数据。Redis 使用主从复制来提高数据可用性。Redis 使用单线程事件循环处理连接和命令，保证数据原子性和一致性。Redis 为键设置过期时间，并使用 lazy 删除机制删除过期键。

redis怎么查看所有的key Apr 10, 2025 pm 07:15 PM

要查看 Redis 中的所有键，共有三种方法：使用 KEYS 命令返回所有匹配指定模式的键；使用 SCAN 命令迭代键并返回一组键；使用 INFO 命令获取键的总数。

redis-server找不到怎么办 Apr 10, 2025 pm 06:54 PM

解决redis-server找不到问题的步骤：检查安装，确保已正确安装Redis；设置环境变量REDIS_HOST和REDIS_PORT；启动Redis服务器redis-server；检查服务器是否运行redis-cli ping。

redis zset怎么使用 Apr 10, 2025 pm 07:27 PM

Redis 有序集合（ZSet）用于存储有序元素集合，并按关联分数进行排序。ZSet 的用法步骤包括：1. 创建 ZSet；2. 添加成员；3. 获取成员分数；4. 获取排名；5. 获取排名范围的成员；6. 删除成员；7. 获取元素个数；8. 获取分数范围内的成员个数。

redis如何查看版本号 Apr 10, 2025 pm 05:57 PM

要查看 Redis 版本号，可以使用以下三种方法：(1) 输入 INFO 命令，(2) 使用 --version 选项启动服务器，(3) 查看配置文件。

redis计数器怎么用 Apr 10, 2025 pm 07:00 PM

Redis 计数器提供了存储和操作计数器的数据结构。具体步骤包括：创建计数器：使用 INCR 命令向现有键添加 1。获取计数器值：使用 GET 命令获取当前值。递增计数器：使用 INCRBY 命令，后面跟要递增的金额。递减计数器：使用 DECR 或 DECRBY 命令，递减 1 或指定金额。重置计数器：使用 SET 命令将其值设置为 0。此外，计数器还可以用于限制速率、会话跟踪和创建投票系统。

redis查询的key怎么唯一 Apr 10, 2025 pm 07:03 PM

Redis采用五种策略确保键的唯一性：1. 名称空间分隔；2. HASH数据结构；3. SET数据结构；4. 字符串键的特殊字符；5. Lua脚本验证。具体策略的选择取决于数据组织、性能和扩展性需求。

See all articles

Redis BloomFilter布隆过滤器如何实现

Bloom Filter 概念

Bloom Filter 原理

缓存穿透

Bloom Filter的缺点

常见问题

go语言实现

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题