以下我们介绍了什么是布隆过滤器?它的使用场景和执行流程,以及在 redis 中它的使用,那么问题来了 , 在日常开发中 , 也就是在 JAVA 开发中,我们又将如何操作布隆过滤器呢?布隆过滤器(Bloom Filter)是一种空间效率极高的概率型数据结构,用于判断一个元素是否在一个集合中 。它基于位数组和多个哈希函数的原理,可以高效地进行元素的查询 , 而且占用的空间相对较?。?如下图所示:
文章插图
根据 key 值计算出它的存储位置 , 然后将此位置标识全部标识为 1(未存放数据的位置全部为 0),查询时也是查询对应的位置是否全部为 1,如果全部为 1,则说明数据是可能存在的,否则一定不存在 。
也就是说,如果布隆过滤器说一个元素不在集合中,那么它一定不在这个集合中;但如果它说一个元素在集合中,则有可能是不存在的(存在误差) 。
1、布隆执行过程布隆过滤器的具体执行步骤如下:
- 在 Redis 中创建一个位数组,用于存储布隆过滤器的位向量 。
- 初始化多个哈希函数,并将每个哈希函数的计算结果对应的位数组位置设置为 1 。
- 添加元素到布隆过滤器时,对元素进行多次哈希计算,并将对应的位数组位置设置为 1 。
- 查询元素是否存在时,对元素进行多次哈希计算,并检查对应的位数组位置是否都为 1 。
- 大数据量去重:可以用布隆过滤器来进行数据去重,判断一个数据是否已经存在,避免重复插入 。
- 缓存穿透:可以用布隆过滤器来过滤掉恶意请求或请求不存在的数据,避免对后端存储的频繁访问 。
- 网络爬虫的 URL 去重:可以用布隆过滤器来判断 URL 是否已经被爬取 , 避免重复爬取 。
(1)打包RedisBloom插件
“【什么是布隆过滤器?如何实现布隆过滤器?】编译正常执行完,会在根目录生成一个 redisbloom.so 文件 。
git clone https://Github.com/RedisLabsModules/redisbloom.git
cd redisbloom
make # 编译redisbloom
”
(2)启用RedisBloom插件重新启动 Redis 服务,并指定启动 RedisBloom 插件,具体命令如下:
“(3)创建布隆过滤器创建一个布隆过滤器 , 并设置期望插入的元素数量和误差率,在 Redis 客户端中输入以下命令:
redis-server redis.conf --loadmodule ./src/modules/RedisBloom-master/redisbloom.so
”
“(4)添加元素到布隆过滤器在 Redis 客户端中输入以下命令:
BF.RESERVE my_bloom_filter 0.01 100000
”
“(5)检查元素是否存在在 Redis 客户端中输入以下命令:
BF.ADD my_bloom_filter leige
”
“课后思考以上我们介绍了什么是布隆过滤器?它的使用场景和执行流程,以及在 Redis 中它的使用,那么问题来了,在日常开发中,也就是在 Java 开发中,我们又将如何操作布隆过滤器呢?
BF.EXISTS my_bloom_filter leige
”
推荐阅读
- 感谢祭是什么意思? 感谢祭是什么意思
- 床底下放什么旺财 运气不好扔三样东西
- 香蕉水是什么 香蕉水是什么成分
- 梦见蛆是什么意思 晚上梦见蛆是什么意思
- 傅首尔前夫老刘发声:我没抑郁症,没被傅首尔打压,离婚还是亲人
- 雷神zero amd版显卡是不是满血版
- 厨房台面什么材料好 现在厨房台面用什么材料好
- 猴和什么属相最配婚姻 猴和什么属相最配
- 全自动洗衣机不进水是什么原因 冬天全自动洗衣机不进水是什么原因
- 2010年属虎的是什么命