Python高级算法与数据结构:使用treap实现双索引之一

开发 后端 大数据 算法
前面介绍的堆结构只能对数据进行部分排序,也就是它只能知道部分元素的排序,例如从根节点出发,沿着左孩子或右孩子前行,我们能得知所遍历的元素一定是递增(小堆)或是递减(大堆)关系,但是我们无法得知左子树与右子树两部分节点的排序关系。

\

前面介绍的堆结构只能对数据进行部分排序,也就是它只能知道部分元素的排序,例如从根节点出发,沿着左孩子或右孩子前行,我们能得知所遍历的元素一定是递增(小堆)或是递减(大堆)关系,但是我们无法得知左子树与右子树两部分节点的排序关系。

在很多应用场景下,我们不但需要堆的特性,例如快速知道数据最大值或最小值,同时还需要知道元素的排序信息,因此本节我们看看如何实现鱼和熊掌如何兼得。假设我们有一系列数据,它的元素由两部分组成,一部分对应商品的名称,其类型为字符串,一部分对应商品的货存数量,类型为整形,我们既需要将商品根据其名称排序,同时我们又需要快速查询当前货存最小的商品,我们如何设计相应的算法和数据结构来满足这样特性呢。

举个例子,如下图:

从上图看,它对应元素字符串是排序二叉树,因此根节点左子树对应元素的字符串都小于根字符串,同时右子树对应的字符串都大于根节点字符串,同时每个元素还对应着相应商品的货存数量,我们需要及时掌握当前货存最少的商品,这样才能在其耗尽之前迅速补货。但是从上图可以看到,要保证字符串的排序性就得牺牲对于商品数量的小堆性质,例如上图中water对应的货存与wine对应的货存违背了小堆的性质,现在问题是如何在保证字符串排序的情况下,确保数量同时能满足小堆性质。

首先我们先定义一下数据结构:

  1. class Node: 
  2.     def __init__(self, key: str, priority: float): 
  3.         self._key = key 
  4.         self._priority = priority 
  5.         self._left: Node = None 
  6.         self._right: Node = None 
  7.         self._parent: Node = None 
  8.  
  9.     @property 
  10.     def left(self): 
  11.         return self._left 
  12.  
  13.     @property 
  14.     def right(self): 
  15.         return self._right 
  16.  
  17.     @property 
  18.     def parent(self): 
  19.         return self._parent 
  20.  
  21.     @left.setter 
  22.     def left(self, node): 
  23.         self._left = node 
  24.         if node is not None: 
  25.             node.parent = self 
  26.  
  27.     @right.setter 
  28.     def right(self, node): 
  29.         self._right = node 
  30.         if node is not None: 
  31.             node.parent = self 
  32.  
  33.     @parent.setter 
  34.     def parent(self, node): 
  35.         self._parent = node 
  36.  
  37.     def is_root(self) -> bool: 
  38.         if self.parent is None: 
  39.             return True 
  40.         return False 
  41.  
  42.     def __repr__(self): 
  43.         return "({}, {})".format(self._key, self._priority) 
  44.  
  45.     def __str__(self): 
  46.         repr_str: str = "" 
  47.         repr_str += repr(self) 
  48.         if self.parent is not None: 
  49.             repr_str += " parent: " + repr(self.parent) 
  50.         else
  51.             repr_str += " parent: None" 
  52.  
  53.         if self.left is not None: 
  54.             repr_str += " left: " + repr(self.left
  55.         else
  56.             repr_str += " left: None" 
  57.  
  58.         if self.right is not None: 
  59.             repr_str += " right: " + repr(self.right
  60.         else
  61.             repr_str += " right: None" 
  62.  
  63.         return repr_str 
  64.  
  65. class Treap: 
  66.     def  __init__(self): 
  67.         self.root : Node = None 

当前问题是,当上图所示的矛盾出现时,我们如何调整,使得字符串依然保持排序性质,同时货存数值能满足小堆性质。我们需要根据几种情况采取不同操作,首先看第一种,如下图:

从上图看到,一种情况是父节点与左孩子在数值上违背了堆的性质,此时我们执行一种叫右旋转操作,其步骤是,1,Beer节点逆时针旋转,替换其父节点;2,父节点Cabbage顺时针旋转,成为Beer的右孩子节点;3,原来Beer的右孩子节点转变为Cabbage的左孩子节点;完成后结果如下图所示:

可以看到,此时字符串依然保持排序二叉树性质,同时数值对应的小堆性质也得到了满足。我们看看代码实现:

  1. class Treap: 
  2.     def __init__(self): 
  3.         self._root: Node = None 
  4.  
  5.     def right_rotate(self, x: Node): 
  6.         if x is None or x.is_root() is True
  7.             return 
  8.  
  9.         y = x.parent 
  10.         if y.left != x:  # 必须是左孩子才能右旋转 
  11.             return 
  12.  
  13.         p = y.parent 
  14.         if p is not None:  # 执行右旋转 
  15.             if p.left == y: 
  16.                 p.left = x 
  17.             else
  18.                 p.right = x 
  19.         else
  20.             self._root = x 
  21.  
  22.         y.left = x.right 
  23.         x.right = y 

接下来我们构造一些数据测试一下上面的实现是否正确:

  1. def setup_right_rotate(): 
  2.     flour: Node = Node("Flour", 10) 
  3.     cabbage: Node = Node("Cabbage", 77) 
  4.     beer: Node = Node("Beer", 76) 
  5.     bacon: Node = Node("Bacon", 95) 
  6.     butter: Node = Node("Butter", 86) 
  7.  
  8.     flour.parent = None 
  9.     flour.left = cabbage 
  10.     flour.right = None 
  11.     cabbage.left = beer 
  12.  
  13.  
  14.     beer.left = bacon 
  15.     beer.right = butter 
  16.  
  17.     return flour, beer 
  18.  
  19. def print_treap(n: Node): 
  20.     if n is None: 
  21.         return 
  22.  
  23.     print(n) 
  24.     print_treap(n.left
  25.     print_treap(n.right
  26.  
  27. treap = Treap() 
  28. root, x , cabbage = setup_right_rotate() 
  29. print("---------before right rotate---------:"
  30. print_treap(root) 
  31. treap.right_rotate(x) 
  32. print("-------after right rotate-------"
  33. print_treap(root) 

上面代码执行后输出内容如下:

  1. ---------before right rotate---------: 
  2. (Flour, 10) parent: None left: (Cabbage, 77) right: None 
  3. (Cabbage, 77) parent: (Flour, 10) left: (Beer, 76) right: (Eggs, 129) 
  4. (Beer, 76) parent: (Cabbage, 77) left: (Bacon, 95) right: (Butter, 86) 
  5. (Bacon, 95) parent: (Beer, 76) left: None right: None 
  6. (Butter, 86) parent: (Beer, 76) left: None right: None 
  7. (Eggs, 129) parent: (Cabbage, 77) left: None right: None 
  8. -------after right rotate------- 
  9. (Flour, 10) parent: None left: (Beer, 76) right: None 
  10. (Beer, 76) parent: (Flour, 10) left: (Bacon, 95) right: (Cabbage, 77) 
  11. (Bacon, 95) parent: (Beer, 76) left: None right: None 
  12. (Cabbage, 77) parent: (Beer, 76) left: (Butter, 86) right: (Eggs, 129) 
  13. (Butter, 86) parent: (Cabbage, 77) left: None right: None 
  14. (Eggs, 129) parent: (Cabbage, 77) left: None right: None 

对比右旋转前后输出的二叉树看,旋转后的二叉树打印信息的确跟上面我们旋转后对应的图像是一致的。接下来我们实现左旋转,先把上图中cabbage节点对应的值改成75,这样它与父节点就违背了小堆性质:

我们要做的是:1,把cabbage节点向“左”旋转到beer的位置;2,beer的父节点设置为cabbage;3:beer的右孩子设置为cabbage的左孩子;4,cabbage的左孩子变成beer;左旋转后二叉树应该成形如下:

从上图看,左旋转后,字符串依然保持二叉树排序性,同时数值的排放也遵守小堆原则,我们看相应的代码实现:

  1. class Treap: 
  2.    ... 
  3.  
  4.     def left_rotate(self, x : Node): 
  5.         if x is None or x.is_root() is True
  6.             return 
  7.  
  8.         y = x.parent 
  9.         if y.right is not x: # 只有右孩子才能左旋转 
  10.             return 
  11.  
  12.         p = y.parent 
  13.         if p is not None: 
  14.             if p.left is y: 
  15.                 p.left = x 
  16.             else
  17.                 p.right = x 
  18.         else
  19.             self._root = x 
  20.  
  21.         y.right = x.left 
  22.         x.left = y 

为了测试上面代码实现,我们首先把cabbage的值修改,然后调用上面代码:

  1. cabbage._priority = 75 
  2. print("-------before left rotate--------"
  3. print_treap(root) 
  4. treap.left_rotate(cabbage) 
  5. print("-------after left rotate---------"
  6. print_treap(root) 

代码运行后输出结果为:

  1. -------before left rotate-------- 
  2. (Flour, 10) parent: None left: (Beer, 76) right: None 
  3. (Beer, 76) parent: (Flour, 10) left: (Bacon, 95) right: (Cabbage, 75) 
  4. (Bacon, 95) parent: (Beer, 76) left: None right: None 
  5. (Cabbage, 75) parent: (Beer, 76) left: (Butter, 86) right: (Eggs, 129) 
  6. (Butter, 86) parent: (Cabbage, 75) left: None right: None 
  7. (Eggs, 129) parent: (Cabbage, 75) left: None right: None 
  8. -------after left rotate--------- 
  9. (Flour, 10) parent: None left: (Cabbage, 75) right: None 
  10. (Cabbage, 75) parent: (Flour, 10) left: (Beer, 76) right: (Eggs, 129) 
  11. (Beer, 76) parent: (Cabbage, 75) left: (Bacon, 95) right: (Butter, 86) 
  12. (Bacon, 95) parent: (Beer, 76) left: None right: None 
  13. (Butter, 86) parent: (Beer, 76) left: None right: None 
  14. (Eggs, 129) parent: (Cabbage, 75) left: None right: None 

输出结果的描述与上图左旋转后的结果是一致的。由于Treap相对于元素的key是排序二叉树,因此在给定一个字符串后,我们很容易查询字符串是否在Treap中,其本质就是排序二叉树的搜索,其实现我们暂时忽略。

虽然查询很简单,但是插入节点则稍微麻烦,因为插入后,新节点与其父节点可能会违背小堆性质,因此在完成插入后,我们还需使用上面实现的左旋转或右旋转来进行调整。

 

责任编辑:武晓燕 来源: Coding迪斯尼
相关推荐

2023-09-25 12:23:18

Python

2011-07-11 15:03:36

MySQL索引数据结构

2020-10-21 14:57:04

数据结构算法图形

2023-03-08 08:03:09

数据结构算法归并排序

2023-10-27 07:04:20

2021-07-15 06:43:12

Python数据结构

2023-03-10 08:07:39

数据结构算法计数排序

2023-03-02 08:15:13

2022-01-09 17:41:37

python算法

2023-03-07 08:02:07

数据结构算法数列

2023-10-06 20:21:28

Python链表

2023-04-27 09:13:20

排序算法数据结构

2023-03-13 10:08:31

数据结构算法

2023-09-15 10:33:41

算法数据结构

2017-08-31 09:45:43

JavaArrayList数据

2023-11-06 06:43:23

单链表查询数据结构

2023-02-08 07:52:36

跳跃表数据结构

2023-10-30 08:31:42

数据结构算法

2021-05-12 09:07:09

Java数据结构算法

2011-07-11 16:05:42

MySQL索引
点赞
收藏

51CTO技术栈公众号