一文精通如何使用二叉树

开发 前端
如何让二叉查找树尽量保持平衡,让时间复杂度维持在O(logn),这是平衡二叉查找树需要做的事情。那什么样子的二叉查找树可以被称为平衡的二叉查找树呢?

一、树

一些基本概念有:

节点、父节点、子节点、兄弟节点、根节点、叶子节点;

高度(从叶子节点往上)、深度(从根节点往下0 ^ (n-1) )、层(从根节点往下1~n);n为层数;

二、二叉树

一些基本的概念:

  • 左子节点、右子节点;二叉树要求每个节点最多只能有两个子节点,但并不要求必须有两个子节点,单独有左子节点或者右子节点都是可以的;
  • 满二叉树,是指所有叶子节点都在最底层,除了叶子节点以外,每个节点都有左右两个子节点;
  • 完全二叉树,是指所有叶子节点都在最底下两层,最后一层的叶子节点是从左到右依次排列的,中间不能有空缺,其它层节点个数都要达到最大,不能有空缺;
  • 存储方法有链式存储法、顺序存储法;

大部分二叉树都可以使用如下链式存储法来进行表示,必然要左右节点空间来指向各自的左子节点和右子节点;

二叉树的链式存储

顺序存储法则是利用一个数组,将当前节点存放在下标为i的地址中,那么左子节点就存放在2i的地址中,右子节点存放在2i+1的地址中;反过来,已知某个节点位置为k,那么它的父节点位置就是k/2;但是当二叉树不是一颗完全二叉树的时候,就会比较浪费数组存储空间;因此,当二叉树为完全二叉树的时候,采用顺序存储是最优的;

完全二叉树的顺序存储

非完全二叉树的顺序存储

  • 遍历分为前序遍历、中序遍历和后序遍历;

前序遍历,先自己,再左边,最后右边;

中序遍历,先左边,再自己,最后右边;

后续遍历,先左边,再右边,最后自己;

三、二叉查找树

在二叉树的基础上,满足如下条件:对于任意一个节点,其左子树上的每个节点值都要小于当前节点的值,其右子树上的每个节点值都要大于当前节点的值;

查找,目标元素target和当前节点比较,如果比当前节点小那么就在左子树中继续查找,反之则在右子树中查找;

插入,目标元素target和当前节点比较,如果比当前节点小并且当前节点没有左子树,那么作为左子节点插入,如果有左子树,那么继续往左遍历;如果比当前节点大并且当前节点没有右子树,那么作为右子节点插入,如果有右子树,那么继续往右遍历;

删除,先找到目标元素,如果目标没有子节点,直接将其删除即可;如果目标有子节点(左右子节点都可),那么将目标节点的父节点指向目标节点的子节点即可;如果目标节点同时拥有左右子树,那么就需要在右子树中找到最小值替换当前节点;(如果想要提高删除的性能,我们还是可以采用标记删除法,以空间换时间)

二叉查找树的删除操作

  • 查找最大值和最小值;
  • 寻找给定元素的前驱和后继节点;
  • 中序遍历输出完全有序的数列,时间复杂度O(n),相较于原先讲过的八大排序算法来说,算是最好的排序算法了;
  • 重复数据的存储;

相同值存放在同一个节点;

相同值存放在右子树;但是要求在查找和删除的时候,一定要遍历到叶子节点才能找到所有相同的元素;

  • 时间复杂度分析,在最坏的情况下,二叉查找树退化为链表,那么所有操作的时间复杂度都是O(n),但是在完全二叉树时,时间复杂度取决于树的高度,就是O(logn);

四、平衡二叉查找树

如何让二叉查找树尽量保持平衡,让时间复杂度维持在O(logn),这是平衡二叉查找树需要做的事情。那什么样子的二叉查找树可以被称为平衡的二叉查找树呢?

严格的定义就是:任意一个节点的左右子树的高度相差不能大于1;比如AVL树,这就是一种高度平衡的,完全符合平衡二叉树定义的。

但是,比较严格的平衡二叉树实现起来有些复杂,需要耗费过多的资源在平衡高度差不超过1这个条件上面,反而矫枉过正了。因此,我们只要能设计出一种二叉查找树,使得所有节点的左右子树看起来相对均衡,那么也可以将它称为符合要求的平衡二叉查找树,比如下面的红黑树。

五、红黑树

红黑树是一种不严格的平衡二叉查找树,它具有以下要求:

  • 根节点是黑色的;
  • 每个叶子节点都是黑色的空节点,不存储数据;
  • 任何上下相邻的节点都不能同时为红色,红色节点是被黑色节点隔开的;
  • 每个节点到到其所有叶子节点的路径都包含相同数目的黑色节点;
  • 插入的节点必须是红色的,新插入的节点都是放在叶子节点上的;

红黑树在插入节点时,如果父节点是黑色的,那么直接插入就行;如果插入的节点是根节点,那么将它改为黑色即可;除此之外的任何情况,都会破坏如上红黑树的要求,此时就需要通过左旋、右旋或者改变颜色才能重新符合红黑树的要求。红黑树的实现过程和平衡过程都比较复杂,一般了解即可。

红黑树具有稳定的性能,在插入、删除和查找时都能稳定在O(logn),同时不会浪费太多资源进行平衡的操作,所以在工业运用上,比严格的平衡二叉查找树要更加地受欢迎。

六、递归树

递归树主要可以用来分析复杂算法的时间复杂度;比如原先说过的归并排序,时间复杂度是O(logn),这个使用递归树怎么分析呢?

归并排序的递归树

归并排序的过程就是每次分解都是1/2,直至每个节点只有一个元素为止,然后从下往上进行相邻节点的归并排序,直至归并为一个数列。

分解的过程时间耗费比较小,因为可以利用数组随机访问的特性一分为二,所以时间可以记为常数C;

归并的时候每层都需要比较n个元素,所以时间复杂度为O(n),假设树的高度为h,那么时间复杂度就是O(hn),其中高度怎么计算呢?在满二叉树的时候,树的高度可以表示为logn,所以归并过程的时间复杂度就近似为O(nlogn),那么整个分解和归并的时间复杂度就是O(C+nlogn),去掉低阶,最终得到归并排序的时间复杂度就是O(logn)。

七、总结

二叉树比散列表的优势在哪里?

散列表中的数据是无序存储的,如果我们需要有序的数列,就必须先排序,时间复杂度取决于你用的排序算法以及无序数据的排列情况,但是肯定不会好于O(n),但是二叉查找树,又称二叉排序树天然就是有序的,只要按照中序遍历输出即可,时间复杂度稳定为O(n);

散列表有扩容操作,哈希计算操作,还会有冲突再散列的问题,其时间效率并不稳定;而平衡二叉树能让查找、插入和删除的时间复杂度能稳定在O(logn);当数据量大的时候,平衡二叉树的优势和性能将会远超散列表;

散列表实现起来比较复杂,需要考虑散列函数的设计、装载因子的设计、扩容和缩容方案、冲突再散列如何解决等;而平衡二叉树只需要考虑平衡的问题,比较简单,方案也比较成熟。

责任编辑:武晓燕 来源: 今日头条
相关推荐

2020-04-27 07:05:58

二叉树左子树右子树

2021-05-06 17:46:30

二叉树数据结构

2021-04-19 07:47:42

数据结构二叉树Tree

2021-04-20 08:37:14

数据结构二叉树

2021-03-17 08:19:22

二叉树LeetCode

2013-07-15 16:35:55

二叉树迭代器

2021-09-29 10:19:00

算法平衡二叉树

2021-12-17 14:26:58

二叉树节点数量

2023-08-29 08:31:13

B+树数据索引

2020-09-23 18:25:40

算法二叉树多叉树

2021-04-28 20:12:27

数据结构创建

2021-11-29 10:40:58

二叉树镜像节点

2022-10-26 23:58:02

二叉树数组算法

2021-08-27 11:36:44

二叉树回溯节点

2021-03-22 08:23:29

LeetCode二叉树节点

2023-05-08 15:57:16

二叉树数据结构

2022-11-06 19:43:10

二叉树指针节点

2022-07-27 07:45:53

二叉树镜像函数

2023-05-10 08:41:40

二叉树遍历算法

2018-03-15 08:31:57

二叉树存储结构
点赞
收藏

51CTO技术栈公众号