什么是一致性hash
一致性哈希算法(Consistent Hashing Algorithm)是一种分布式算法,常用于负载均衡。Memcached client也选择这种算法,解决将key-value均匀分配到众多Memcached server上的问题。它可以取代传统的取模操作,解决了取模操作无法应对增删Memcached Server的问题(增删server会导致同一个key,在get操作时分配不到数据真正存储的server,命中率会急剧下降)。
一致性哈希将整个哈希值空间组织成一个虚拟的圆环,如假设某哈希函数H的值空间为0-2^32-1(即哈希值是一个32位无符号整形)。
整个空间按顺时针方向组织,0和232-1在零点中方向重合。
一致性hash有什么用
一致性hash算法常用于分布式缓存服务,把所有的服务节点进行hash,得到hash环上的位置。
添加进服务的数据用同样的算法进行hash,然后从hash环上取得大于该hash值的第一个节点,如果没有大于该值的节点,那么就取整个环的第一个节点。
存在问题
在节点太少的情况,有可能存在hash偏移。就是节点负载不均衡,大量数据落在其中一个节点上面。
解决办法是,在环上面虚拟出足够多的节点,虚拟的节点和实际节点做对应。
java代码实现
package com.hj.lock.alg;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
import java.util.*;
public class ConsistentHash<T> {
/**
* Hash计算对象,用于自定义hash算法
*/
HashFunc hashFunc;
/**
* 复制的节点个数
*/
private final int numberOfReplicas;
/**
* 一致性Hash环
*/
private final TreeMap<Long, T> hashCircle = new TreeMap<>();
/**
* 构造,使用Java默认的Hash算法
*
* @param numberOfReplicas 复制的节点个数,增加每个节点的复制节点有利于负载均衡
* @param
public ConsistentHash(int numberOfReplicas, Collection<T> nodes){
this.numberOfReplicas = numberOfReplicas;
this.hashFunc = ConsistentHash::md5HashingAlg;
//初始化节点
nodes.forEach(node -> add(node));
}
/**
* 增加节点<br>
* 每增加一个节点,就会在闭环上增加给定复制节点数<br>
* 例如复制节点数是2,则每调用此方法一次,增加两个虚拟节点,这两个节点指向同一Node
* 由于hash算法会调用node的toString方法,故按照toString去重
*
* @param
public void add(T node){
for (int i = 0; i < numberOfReplicas; i++) {
hashCircle.put(hashFunc.hash(node.toString() + i), node);
}
}
/**
* 移除节点的同时移除相应的虚拟节点
*
* @param
public void remove(T node){
for (int i = 0; i < numberOfReplicas; i++) {
hashCircle.remove(hashFunc.hash(node.toString() + i));
}
}
/**
* 获得一个最近的顺时针节点
*
* @param key 为给定键取Hash,取得顺时针方向上最近的一个虚拟节点对应的实际节点
* @return
public T get(Object key){
if (hashCircle.isEmpty()) {
return null;
}
long hash = hashFunc.hash(key);
hash = nextHash(hash);
//正好命中
return hashCircle.get(hash);
}
public Long nextHash(Long hash){
if (!hashCircle.containsKey(hash)) {
Long next = hashCircle.higherKey(hash + 1);//返回下一个hash值
hash = next == null ? hashCircle.firstKey() : next;
}
return hash;
}
/**
* 使用MD5算法
*
* @param key
* @return
private static long md5HashingAlg(Object key){
MessageDigest md5 = null;
try {
md5 = MessageDigest.getInstance("MD5");
md5.reset();
String str = key.toString();
md5.update(str.getBytes());
byte[] bKey = md5.digest();
long res = ((long) (bKey[3] & 0xFF) << 24) | ((long) (bKey[2] & 0xFF) << 16) | ((long) (bKey[1] & 0xFF) << 8) | (long) (bKey[0] & 0xFF);
return res;
} catch (NoSuchAlgorithmException e) {
e.printStackTrace();
}
return 0l;
}
/**
* 使用FNV1hash算法
*
* @param key
* @return
private static long fnv1HashingAlg(Object key){
final int p = 16777619;
int hash = (int) 2166136261L;
String str = key.toString();
for (int i = 0; i < str.length(); i++) {
hash = (hash ^ str.charAt(i)) * p;
}
hash += hash << 13;
hash ^= hash >> 7;
hash += hash << 3;
hash ^= hash >> 17;
hash += hash << 5;
return hash;
}
/**
* Hash算法对象,用于自定义hash算法
*/
public interface HashFunc {
public Long hash(Object key);
}
public static void main(String[] args){
List<String> nodes = new ArrayList<>();
System.out.println("--添加节点 ABC");
nodes.add("A");
nodes.add("B");
nodes.add("C");
ConsistentHash<String> chash = new ConsistentHash(1, nodes);
System.out.println(chash.get("test1"));
System.out.println(chash.get("aest2"));
System.out.println(chash.get("dest3"));
System.out.println("--添加节点 D");
chash.add("D");
System.out.println(chash.get("test1"));
System.out.println(chash.get("aest2"));
System.out.println(chash.get("dest3"));
for (Iterator<Map.Entry<Long, String>> it = chash.hashCircle.entrySet().iterator(); it.hasNext(); ) {
Map.Entry<Long, String> entry = it.next();
Long k = entry.getKey();
System.out.println(k + ":" + entry.getValue());
System.out.println(Math.abs(chash.nextHash(k + 1) - k));
}
}
}
以上代码输出值:
--添加节点 ABC
C
C
A
--添加节点 D
D
C
A
748451404:B
1081611916
1830063320:A
1542566198
3372629518:D
491985806
3864615324:C
3116163920
参考
https://www.cnblogs.com/lpfuture/p/5796398.html