数据结构:跳跃链表

开发 前端
开发时经常使用的平衡数据结构有B数、红黑数,AVL数。但是如果让你实现其中一种,很难,实现起来费时间。而跳跃链表一种基于链表数组实现的快速查找数据结构,目前开源软件 Redis 和 LevelDB 都有用到它。

[[415029]]

本文转载自微信公众号「潜行前行」,作者cscw。转载本文请联系潜行前行公众号。

什么是跳跃链表

开发时经常使用的平衡数据结构有B数、红黑数,AVL数。但是如果让你实现其中一种,很难,实现起来费时间。而跳跃链表一种基于链表数组实现的快速查找数据结构,目前开源软件 Redis 和 LevelDB 都有用到它。它的效率和红黑树以及 AVL 树不相上下

跳跃链表结构

结构

  1. public class SkipList<T> { 
  2.     //跳跃表的头尾 
  3.     private SkipListNode<T> head; 
  4.     //跳跃表含的元素长度 
  5.     private int length; 
  6.     //跳表的层数 的历史最大层数 
  7.     public int maxLevel; 
  8.     public SecureRandom random; 
  9.     private static final int MAX_LEVEL = 31; 
  10.     public SkipList() { 
  11.         //初始化头尾节点及两者的关系 
  12.         head = new SkipListNode<>(SkipListNode.HEAD_SCORE, null, MAX_LEVEL); 
  13.         //初始化大小,层,随机 
  14.         length = 0; 
  15.         maxLevel = 0; // 层数从零开始计算 
  16.         random = new SecureRandom(); 
  17.     } 
  18.     ... 
  • header:指向跳跃表的头节点
  • maxLevel:记录目前跳跃表,层数最大节点的层数
  • length:链表存在的元素长度

节点

跳跃链表节点的组成:前节点、后节点、分值(map的key值)、及存储对象 value

  1. public class SkipListNode<T> { 
  2.     //在跳表中排序的 分数值 
  3.     public double score; 
  4.     public T value; 
  5.     public int level
  6.     // 前后节点 
  7.     public SkipListNode<T> next,pre; 
  8.     //上下节点形成的层 
  9.     public SkipListNode<T>[] levelNode; 
  10.     private SkipListNode(double score, int level){ 
  11.         this.score = score; 
  12.         this.level = level
  13.     } 
  14.     public SkipListNode(double score, T value, int level) { 
  15.         this.score = score; 
  16.         this.value = value; 
  17.         this.level = level
  18.         this.levelNode = new SkipListNode[level+1]; 
  19.         //初始化 SkipListNode 及 每一层的 node 
  20.         for (int i = level; i > 0; --i) { 
  21.             levelNode[i] = new SkipListNode<T>(score, level); 
  22.             levelNode[i].levelNode = levelNode; 
  23.         } 
  24.         this.levelNode[0] = this; 
  25.     } 
  26.     @Override 
  27.     public String toString() {  return "Node[score=" + score + ", value=" + value + "]"; } 

跳表是用空间来换时间

在我实现的跳跃链表节点,包括一个 levelNode 成员属性。它就是节点层。跳跃链表能实现快速访问的关键点就是它

平时访问一个数组,我们是顺序遍历的,而跳跃链表效率比数组链表高,是因为它使用节点层存储多级索引,形成一个稀疏索引,所以需要的更多的内存空间

跳跃链表有多快

如果一个链表有 n 个结点,每两个结点抽取出一个结点建立索引的话,那么第一层索引的结点数大约就是 n/2,第二层索引的结点数大约为 n/4,以此类推第 m 层索引的节点数大约为 n/(2^m)

访问数据时可以从 m 层索引查询定位到 m-1 层索引数据。而 m-1 大约是 m 层的1/2。也就是说最优的时间复杂度为O(log/N)

最差情况。在实际实现中,每一层索引是无法每次以数据数量对折一次实现一层索引。因此折中的方式,每一层的索引是随机用全量数据建一条。也就是说最差情况时间复杂度为O(N),但最优时间复杂度不变

查询

查询一开始是遍历最高层 maxLevel 的索引 m。按照以下步骤查询出等于 score 或者最接近 score 的左节点

1:如果同层索引的 next 节点分值小于查询分值,则跳到 next 节点。cur = next

2:如果 next 为空。或者next节点分值大于查询分值。则跳到下一层 m-1 索引,循环 2

循环 1、2 步骤直到访问到节点分值和查询分值一致,或者索引层为零

  1. // SkipList 
  2.     private SkipListNode<T> findNearestNode(double score) { 
  3.         int curLevel = maxLevel; 
  4.         SkipListNode<T> cur = head.levelNode[curLevel]; 
  5.         SkipListNode<T> next = cur.next
  6.         // 和当前节点分数相同 或者 next 为 null 
  7.         while (score != cur.score && curLevel > 0) { 
  8.             // 1 向右 next 遍历 
  9.             if (next != null && score >= next.levelNode[0].score) { 
  10.                 cur = next
  11.             } 
  12.             next = cur.levelNode[curLevel].next
  13.             // 2 向下遍历,层数减1 
  14.             while ((next == null || score < next.levelNode[0].score) && curLevel > 0) { 
  15.                 next = cur.levelNode[--curLevel].next; 
  16.             } 
  17.         } 
  18.         // 最底层的 node。 
  19.         return cur.levelNode[0]; 
  20.     } 
  21.     public SkipListNode<T> get(double score) { 
  22.         //返回跳表最底层中,最接近这个 score 的node 
  23.         SkipListNode<T> p = findNearestNode(score); 
  24.         //score 相同,返回这个node 
  25.         return p.score == score ? p : null
  26.     } 

插入

如果分值存在则替换 value

如果分值对应节点不存在,则随机一个索引层数 level (取值 0~31)。然后依靠节点属性 levelNode 加入 0 到 level 层的索引

  1. //SkipList 
  2.     public T put(double score, T value) { 
  3.         //首先得到跳表最底层中,最接近这个key的node 
  4.         SkipListNode<T> p = findNearestNode(score); 
  5.         if (p.score == score) { 
  6.             // 在跳表中,只有最底层的node才有真正的value,只需修改最底层的value就行 
  7.             T old = p.value; 
  8.             p.value = value; 
  9.             return old; 
  10.         } 
  11.         // nowNode 为新建的最底层的node。索引层数 0 到 31 
  12.         int nodeLevel = (int) Math.round(random.nextDouble() * 32); 
  13.         SkipListNode<T> nowNode = new SkipListNode<T>(score, value, nodeLevel); 
  14.         //初始化每一层,并连接每一层前后节点 
  15.         int level = 0; 
  16.         while (nodeLevel >= p.level) { 
  17.             for (; level <= p.levellevel++) { 
  18.                 insertNodeHorizontally(p.levelNode[level], nowNode.levelNode[level]); 
  19.             } 
  20.             p = p.pre; 
  21.         } 
  22.         // 此时 p 的层数大于 nowNode 的层数才进入循环 
  23.         for (; level <= nodeLevel; level++) { 
  24.             insertNodeHorizontally(p.levelNode[level], nowNode.levelNode[level]); 
  25.         } 
  26.         this.length ++ ; 
  27.         if (this.maxLevel < nodeLevel) { 
  28.             maxLevel = nodeLevel; 
  29.         } 
  30.         return value; 
  31.     } 
  32.  
  33.     private void insertNodeHorizontally(SkipListNode<T> pre, SkipListNode<T> now) { 
  34.         //先考虑now 
  35.         now.next = pre.next
  36.         now.pre = pre; 
  37.         //再考虑pre的next节点 
  38.         if (pre.next != null) { 
  39.             pre.next.pre = now; 
  40.         } 
  41.         //最后考虑pre 
  42.         pre.next = now; 
  43.     } 

删除

使用 get 方法找到元素,然后解除节点属性 levelNode 在每一层索引的前后引用关系即可

  1. //SkipList 
  2.     public T remove(double score){ 
  3.         //在底层找到对应这个key的节点 
  4.         SkipListNode<T> now = get(score); 
  5.         if (now == null) { 
  6.             return null
  7.         } 
  8.         SkipListNode<T> curNode, next
  9.         //解除节点属性 levelNode 在每一层索引的前后引用关系 
  10.         for (int i = 0; i <= now.level; i++){ 
  11.             curNode = now.levelNode[i]; 
  12.             next = curNode.next
  13.             if (next != null) { 
  14.                 next.pre = curNode.pre; 
  15.             } 
  16.             curNode.pre.next = curNode.next
  17.         } 
  18.         this.length--; //更新size,返回旧值 
  19.         return now.value; 
  20.     } 

使用示例

  1. public static void main(String[] args) { 
  2.     SkipList<String> list=new SkipList<>(); 
  3.     list.printSkipList(); 
  4.     list.put(1, "csc"); 
  5.     list.printSkipList(); 
  6.     list.put(3, "lwl"); 
  7.     list.printSkipList(); 
  8.     list.put(2, "hello world!"); 
  9.     list.printSkipList(); 
  10.  
  11.     System.out.println(list.get(2)); 
  12.     System.out.println(list.get(4)); 
  13.     list.remove(2); 
  14.     list.printSkipList(); 

欢迎指正文中错误

参考文章 

  • redis设计与实现
  • 跳表(跳跃表,skipList)总结-java版[1]
  • 数据结构与算法——跳表[2]

 

责任编辑:武晓燕 来源: 潜行前行
相关推荐

2023-02-08 07:52:36

跳跃表数据结构

2021-05-12 14:09:35

链表数据结构线性结构

2021-07-15 06:43:12

Python数据结构

2021-07-13 07:52:03

Python数据结构

2017-03-01 13:58:46

Python数据结构链表

2021-10-29 11:27:52

链表数据结构算法

2021-01-06 08:03:00

JavaScript数据结构

2012-02-02 10:21:05

单链表nexthead

2021-01-28 07:33:34

JavaScript链表数据

2021-04-12 15:47:00

数据结构算法链表

2021-03-10 08:42:19

Java数据结构算法

2021-12-21 08:19:29

数据结构算法链表相交

2011-03-31 15:41:51

Cacti数据表结构

2023-10-31 08:51:25

数据结构存储数据

2012-04-28 14:21:47

Java数据结构线性结构

2021-03-11 08:53:20

Java数据结构算法

2020-10-28 10:10:03

Java单链表数据结构

2023-10-06 20:21:28

Python链表

2020-10-21 14:57:04

数据结构算法图形

2023-11-12 21:49:10

Redis数据库
点赞
收藏

51CTO技术栈公众号