一致性哈希算法的介绍与实现( 二 ) _一致性哈希算法

其中标准差较小，说明分布较为均匀，那我们的需求达到了。
接着，随着业务的发展，你发现100个节点不够用了，我们希望再增加10个节点，来提高系统性能。而我们还将继续采用之前的方法来分布数据。这时候就出现了一个新的问题，我们是通过“哈希+取模”来决定数据的相应节点，原来数据的哈希值是不会改变的，可是取模的时候节点的数量发生了变化，这将导致的结果就是原来的数据存在A节点，现在可能需要迁移到B节点，也就是数据迁移问题。下面我们来看下有多少数据将发生迁移。
【一致性哈希算法的介绍与实现】private static int newNodeNum = 11;private static List<String> newNodes = initNode(newNodeNum);public static void normalHashMigrateMain() { int migrateCount = 0; for (Integer data : datas) { String node = normalHash(data, nodes); String newNode = normalHash(data, newNodes); if (!node.equals(newNode)) { migrateCount++; } } System.out.println(String.format("数据迁移量：%d（%.2f%%）", migrateCount, migrateCount * 100.0 / datas.size()));}/**数据迁移量：9091127（90.91%）**/有90%多的数据都需要进行迁移，这是几乎全部的量了。普通哈希的问题暴露出来了，当将节点由100扩展为110时，会存在大量的迁移工作。在1997年MIT提出了一致性哈希算法，用于解决普通哈希的这一问题。
我们再分析下，假设hash值为10000 ， nodeNum为100 ，那按照index = hash % nodeNum得到的结果是0 ，而将100变为110时，取模的结果将改变为100 。如果我们将取模的除数增大至大于hash值，那hash值取模的结果将仍是其本身。也就是说，只要除数保证大于hash值，那取模的结果将不会改变。这里的hash值是int ， 4个字节，那我们把除数固定为2^32-1 ， index = hash % (2^32-1) 。取模的结果也将固定在0到2^32-1中，可将其构成一个环，如下所示。

文章插图

取模的结果范围
现在的除数是2^32-1 ， hash值为10000 ，取模的结果为10000 ，而我们有100个节点，该映射到哪个节点上呢？我们可以先将节点通过哈希映射到环上。为了绘图方便，我们以3个节点为例，如下图所示：

文章插图

一致性哈希环
10000落到环上后，如果没有对应的节点，则按顺时针方向找到下一个节点，便为hash值对应的节点。下面我们用JAVA的TreeMap来存节点的hash值，利用TreeMap的tailMap寻找节点。
我们使用和之前同样的方法，测试下当节点由100变为110时，数据需要迁移的情况，如下所示：

public static void consistHashMigrateMain() {    int migrateCount = 0;    SortedMap<Integer, String> circle = new TreeMap<>();    for (String node : nodes) {        circle.put(hash(node), node);    }    SortedMap<Integer, String> newCircle = new TreeMap<>();    for (String node : newNodes) {        newCircle.put(hash(node), node);    }    for (Integer data : datas) {        String node = consistHash(data, circle);        String newNode = consistHash(data, newCircle);        if (!node.equals(newNode)) {            migrateCount++;        }    }    System.out.println(String.format("数据迁移量：%d（%.2f%%）", migrateCount, migrateCount * 100.0 / datas.size()));}public static String consistHash(Integer data, SortedMap<Integer, String> circle) {    int hash = hash(data);    // 从环中取大于等于hash值的部分    SortedMap<Integer, String> subCircle = circle.tailMap(hash);    int index;    // 如果在大于等于hash值的部分没有节点 ， 则取环开始的第一个节点    if (subCircle.isEmpty()) {        index = circle.firstKey();    } else {        index = subCircle.firstKey();    }    return circle.get(index);}/**数据迁移量：817678（8.18%）**/
上一页
1
2
3
下一页
		  	





























推荐阅读

           
                  
              
                  高通骁龙■高通骁龙875曝光，5nm工艺制程，搭载骁龙865的手机要跌价了 
                
                   
                
              
            

                  
              
                  输入手机号就能确定对方位置 
                
                   
                
              
            

                  
              
                  深井盐是海盐吗 
                
                   
                
              
            

                  
              
                  西瓜 西瓜冰冻可以放多久 
                
                   
                
              
            

                  
              
                  5G苹果中国对iPhone 11等产品八折降价促销：收割4G最后一批用户？ 
                
                   
                
              
            

                  
              
                  京新高速|京新高速一车雨天失控 防护栏直穿车厢司机受伤 
                
                   
                
              
            

                  
              
                  历史上的秦王嬴政的父亲是吕不韦吗,秦王嬴政的生父是不是吕不韦- 
                
                   
                
              
            

                  
              
                  单反▲手机也能当单反，这三款手机的拍照能力真的很强，可以考虑入手 
                
                   
                
              
            

                  
              
                  男子捡只“大鹅”想回家做东北名菜，要杀鹅时… 
                
                   
                
              
            

                  
              
                  一读|因霸凌周冬雨走红，被誉为小章子怡，网友：真·富家大小姐！，她是北电校花 
                
                   
                
              
            

                  
              
                  #程序员#智能手表也有“独立人格”，四款高颜值智能手表推荐 
                
                   
                
              
            

                  
              
                  白银市长在发布会上鞠躬道歉，昨日由其现场宣布越野赛开幕 
                
                   
                
              
            

                  
              
                  扬子晚报|男子跟团游被逼买房？官方通报来了 
                
                   
                
              
            

                  
              
                  加勒比海盗女主角是谁。加勒比海盗4女主角不是凯拉·奈特利吗 
                
                   
                
              
            

                  
              
                  新华网|田间“双抢”农事忙 
                
                   
                
              
            

                  
              
                  天天看精彩不断这类存款利息被“叫停”？和所有储户息息相关，存款迎来新条例 
                
                   
                
              
            

                  
              
                  小黑科技Ali 后置浴霸三摄，摩托罗拉G10曝光：挖孔屏设计 
                
                   
                
              
            

                  
              
                  #美军#终于一举反超美军，国宝女院士造出全新导弹，300万奖金不交1分税 
                
                   
                
              
            

                  
              
                  7月期间，100%改头换面，重新开始，一切顺利的五大生肖！ 
                
                   
                
              
            

                  
              
                  董志华：“五郎八卦棍”董志华：老婆王京花，儿子董子健，儿媳妇孙怡 
                
                   
                
              
            

          

《机器学习算法的几大分类》 

最大熵强化学习算法SAC 

Python量化工具之“k线波幅加速”算法跟踪止盈，仅需一行代码 

百度搜索正式升级冰桶算法5.0 

加解密算法分析 

字节跳动面试必会：快速选择算法，TopK问题最优解 

插入排序算法解析 

回溯算法的题目，这样做，秒杀 

降维算法：主成分分析 VS 自动编码器 

利用YOLOV3检测算法来实现人物定位与距离计算，打造全球定位系统