那些年向前冲大厂二面：Redis的分布式布隆过滤器是什么原理？欢迎关注头条号：老顾聊技术

欢迎关注头条号：老顾聊技术
精品原创技术分享，知识的组装工
问题老顾先来举个常会问到的面试题：现有50亿个电话号码，现有10万个电话号码，如何要快速准确的判断这些电话号码是否已经存在？
上面的问题可以细化一下，也就是50亿个电话号码在数据库中，现在要快速、准确的判断提供的10万个电话号码是否存在。
我们小伙伴们是否脑子中会有以下方案：
1、通过数据库查询：实现快速有点难。 2、数据预放到内存集合中：50亿*8字节大约40G ，内存太大了。实际项目中也会遇到类似的问题，如垃圾邮件过滤、网络爬虫重复url检测等，本质就是判断数据存不存在一个大的集合中。
那如何去解决呢？这就是我们今天老顾要介绍的布隆过滤器方案，我们继续往下看。
布隆过滤器布隆过滤器是一种类似set的数据结构，只是不太准确，当判断元素是否存在时返回结果存在但真实不一定存在；当返回不存在时肯定是不存在，所以判断去重时有一定的误判概率。
当然，误判只会发生在过滤器没有添加过的元素，对于添加过的元素不会发生误判。
特点：高效地插入和查询，占用空间少，返回的结果是不确定性的。
布隆过滤器原理这个是由柏顿.布隆在1970年提出，用很小的空间，解决上述的类似问题。
实现原理就是我们需要一个很长的二进制数组（也叫向量）；在添加数据时，使用多个hash函数对key进行hash运算得到一个索引值（即二进制数组的索引值）
布隆过滤器误差空间占用布隆过滤器的空间占用有一个简单的计算公式，但推导比较繁琐。布隆过滤器有两个参数，预计元素数量n ，错误率f ，公式得到两个输出，位数组长度L（即存储空间大小bit）， hash函数的最佳数量k 。
k=0.7*(1/n)
f=0.6185^(L/n)
1、位数组相对长度越长，错误率越低；2、位数组相对长度越长，需要的hash函数越多；3、当一个元素平均需要一个字节（8bit）的指纹空间时（L/n=8) ，错误率大约为2% 。实际元素超出时f=(1-0.5^t)^k#t为实际元素与预计元素的倍数1、当错误率为10%时，倍数比为2时，错误率接近40%；2、当错误率为1% ，倍数比为2时，错误率15%；3、当错误率为0.1% ，倍数为2时，错误率5%以上小伙伴们只要知道会存在误差就行了，不需要强求是怎么计算的
Redis布隆过滤器的基本使用在Redis中，布隆过滤器有两个基本命令，分别是：
bf.add：添加元素到布隆过滤器中，类似于集合的sadd命令，不过bf.add命令只能一次添加一个元素，如果想一次添加多个元素，可以使用bf.madd命令。 bf.exists：判断某个元素是否在过滤器中，类似于集合的sismember命令，不过bf.exists命令只能一次查询一个元素，如果想一次查询多个元素，可以使用bf.mexists命令。 >bf.addone-more-filterfans1(integer)1>bf.addone-more-filterfans2(integer)1>bf.existsone-more-filterfans3(integer)1>bf.existsone-more-filterfans4(integer)0>bf.maddone-more-filterfans4fans5fans61)(integer)12)(integer)13)(integer)1>bf.mexistsone-more-filterfans4fans5fans6fans71)(integer)12)(integer)13)(integer)1布隆过滤器的高级使用上面的例子中使用的布隆过滤器只是默认参数的布隆过滤器，它在我们第一次使用bf.add命令时自动创建的。 Redis还提供了自定义参数的布隆过滤器，想要尽量减少布隆过滤器的误判，就要设置合理的参数。

那些年向前冲大厂二面：Redis的分布式布隆过滤器是什么原理？

推荐阅读

##100%胜率的妖股见顶信号！

玉林新闻网|重要文件随车被盗，民警火速帮失主寻回

梦到死去的亲人哭梦见死去的亲人哭是什么意思_梦到死去的亲人哭代表...

小雪|今日小雪，曼舞盼君来

价格发现功能|[快讯]上交所阙波：注册制的本质是厘清政府和市场的基本关系

松柏的象征意义作文松柏的象征意义

能源|广汇能源：申能集团将受让恒大集团所持广汇集团相应股权成为广汇集团二股东

「资深娱乐家」MAX提车及用车分享，选择了我就不后悔全新荣威RX5

退休：国内适合退休后生活的3座城市，每一个都很舒适，你会选哪一个？

『青岛』报复性运动！青岛大爷摔断腿，济南和重庆都有人猝倒

少女|母亲离世后，张爱玲喃喃自语：来日，我一定会去找她赔罪的

每日互联网■10nm++处理器曝光追赶友商步伐，告别14nm+++！英特尔不再挤牙膏

「成都英博口腔医生」未成年人矫正牙齿，利多还是弊多？看这篇全面分析就够了

「流行病」世卫组织强调新冠肺炎疫情仍未构成“大流行病”

火影之伊邪那岐小说火影之伊邪那岐

中国|勃林格殷格翰启动中国外部创新中心，未来5年投4.5亿欧元

周星驰|周星驰曾经问过，当时很红的女明星：阿姐，你说将来我会不会红？

柠檬精啊|2大“援军”齐齐出招，这次连富士康也出手了，华为不是孤军奋战

华佗学医中华佗是一个什么样的人华佗学医让我们明白了什么道理

乘联会：预估7月主要厂商乘用车零售同比增长6%，环比下降6%

那些年向前冲 大厂二面：Redis的分布式布隆过滤器是什么原理？

推荐阅读

那些年向前冲大厂二面：Redis的分布式布隆过滤器是什么原理？