你知道“二分”,那你知道“三路切分”吗?

开发 前端
尽管与位运算相比,这种解法算不上最优,不过也不失一种有趣的解法。数组其实是另外一种形式的二叉树,只不过有时候需要我们动态地把左/右子树给切分出来,不同的切分方式,可以解决不同的问题。

在这里核心就是算法思想叫做"三路切分"。 “三路切分” 曾是 EMC 面试中的常客,这个名词听起来很高大上,但是简单来说就是将数组切分成三部分。 我再回忆一下“快速排序”算法。

// 交换数组中两个元素的值 
function swap(a, i, j) {
  const temp = a[i];
  a[i] = a[j];
  a[j] = temp;
}
function qsort(a, b, e) {
  // 边界处理
  if (b >= e || b + 1 >= e) {
    return;
  }
  
  // 第一步:划分子结构
  const mid = b + ((e - b) >> 1);
  
  // 第二步:找到根节点,获取信息
  const x = a[mid];
  let l = b;
  let i = b;
  let r = e - 1;
  
  while(i <= r) {
    if (a[i] < x) {
      swap(a, l++, i++);
    } else if (a[i] === x) {
      i++;
    } else {
      swap(a, r--, i);
    }
  }
  
  // 第三步:将根节点信息传递给左右子数组
  qsort(a, b, l);
  qsort(a, i, e);
}

// 主函数,将数组nums排序 
function  quickSort(nums) {
  if (nums == null)
    return;
  qsort(nums, 0, nums.length);
    return nums;
}

那为什么需要“三路切分”,它的意义是什么?这里看一个例子:

输入:[2, 1, 0]
输出:[0, 1, 2]
如何只通过 swap 操作,将这个数组进行排序?
要求:你的时间复杂度需要是 O(N),空间复杂度需要是 O(1)。

在快速排序的时候,我们通过一个整数 x 将数组切分成小于、等于、大于三部分。问题的关键就是如何在时间复杂度 O(N),空间复杂度 O(1) 条件下完成这个操作。

对于快速排序而言,通过一个整数 x 将数组切分成:

  • 小于 x 部分;
  • 等于 x 的部分;
  • 大于 x 的部分;

本质上来说,其实包含四部分:

  • 小于 x 部分;
  • 等于 x 的部分;
  • 还未处理数的部分;
  • 大于 x 的部分;

图片图片

我们假设这四部分分别对于四个区间:

  • 小于 x 部分:[0, l);
  • 等于 x 的部分[l, i);
  • 还未处理数的部分[i, r];
  • 大于 x 的部分(r, length);

图片图片

在进行排序是,我们划分结构读取的是 [i, r) 区间的值。 在 [i, r) 区间中的值 x 取值只可能是下面 3 种情况:

  • x 属于 [0, l) 区间;
  • x 属于 [l, i) 区间;
  • x 属于 (r, length) 区间;

快速排序的目的就是将[i, r]区间的取,全部插入到其他区间,完成排序操作。

1. x 属于 [0, l) 区间

如果 x 属于 [0, l) 区间,那么我们就需要将 x 插到 [0, l) 区间。

图片图片

将 x 插入到 [0, l) 这个区间除了像插入排序一样一个一个地移动,还有没有更好的办法呢?

答案是,有,我并不需要一个一个移动!因为 [l, i) 区间里面全都是等于 x 的部分,只需要将的 nums[l] 与 nums[i] 进行交换即可。这就回答了第一个问题?为什么我们在节点排序处理是通过 swap 操作?

图片图片

这时候整个[l, i) 区间整体向右平移一步,整个[i, r) 区间也整体向右平移一步。所以需要执行 l++, i++。

if (a[i] < x) {
  swap(a, l++, i++);
}

2. 如果 x 属于 [l, i) 区间

如果 x 属于 [l, i) 区间,也就是等于 x 的部分,那么我们就需要将 x 插到 [l, i) 区间,这里就比较简单了,只需要为  [l, i) 区间扩展一下就好了。相当于在  [l, i) 区间添加了一个元素,所以需要执行  i++。

图片图片

else if (a[i] === x) {
  i++;
}

3. 如果 x 属于 (r, length) 区间

如果 x 属于 (r, length) 区间,也就是大于 x 的部分,那么我们就需要将 x 插到  (r, length) 区间,相当于 (r, length)区间向左平移了一步,这时候 r--。

图片图片

else {
  swap(a, r--, i);
}

最终状态:所有的数都被处理之后,[i, r] 区间肯定为空集。由于两边都是取闭,那么必然当 i > r 的时候,[i, r] 才是空集。原本的四个区间,变成三个区间。

  • [0, l)  小于 x 的区间
  • [l, i)  等于 x 的区间
  • [i, length) 大于 x 的区间。

注意此时由于 i > r,实际上 i = r + 1,那么区间 (r, length) 就是 [i, length)。 由于最终状态是将一个乱序的数组切分成三部分,所以这个方法又叫三路切分。

接下来我们看一个例子:

列1:只出现一次的数字

给你一个 非空 整数数组 nums ,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出现了一次的元素。 你必须设计并实现线性时间复杂度的算法来解决此问题,且该算法只使用常量额外空间。

示例 1 :

输入:nums = [2,2,1]
输出:1
示例 2 :

输入:nums = [4,1,2,1,2]
输出:4
示例 3 :

输入:nums = [1]
输出:1

这道题目想想用“三路切分”如何实现?

任意选中一个数字 x ,将数组分成三份,那么是不是会出现三种情况?

  • 第一种:只出现一次的数字在 x 左边,那么左边区域的长度为奇数,因为其他的数都是出现了两次。
  • 第二种:选中的 x 就是只出现一次的数组,左右两边区间长度都为偶数。
  • 第三种:只出现一次的数在右边,那么右区间的长度为奇数。

通过分析可知 3 种情况中,只有第二种情况得到了结果。而第一种情况只出现 1 次的数在左区间时,只需要递归地处理左区间;第三种情况只出现 1 次的数在右区间时,只需要递归地处理右区间。

function swap(A, i, j) {
  const t = A[i];
  A[i] = A[j];
  A[j] = t;
}
function threeSplit(a, b, e) {
  // 边界情况
  if (b >= e) {
      return 0;
    }
  /*********************核心代码****************************/
  // 第一步:划分子结构
  const mid = b + ((e - b) >> 1);
  // 第二步:获取根节点信息 x
  const x = a[mid];
  // 根据 x 将数组一分为三 【三路切分】
  let l = b;
  let i = b;
  let r = e - 1;
  while(i <= r) {
      if (a[i] < x) {
          // 小于 x 的部分
          swap(a, l++, i++);
      } else if (a[i] === x) {
          // 等于 x 的部分
          i++;
      } else {
          // 大于 x 的部分
          swap(a, r--, i);
      }
  }

  // 第三步:将根节点的信息传递左右子子树
  // 切分完毕之后,只有三个区间
  // [b, l) [l, i) [i, N)

  // 中间区间
  if ((i - l) === 1) {
    return a[l]
  }
  // 左区间
  if (((l - b) % 2) == 1) {
    return threeSplit(a, b, l);
  }
  // 右区间
  return threeSplit(a, i, e);
  /*********************核心代码****************************/
}
// 主函数
function main(nums) {
  if (nums == null || nums.length <= 0) {
    return 0;
  }
  return threeSplit(nums, 0, nums.length);
}

总结

尽管与位运算相比,这种解法算不上最优,不过也不失一种有趣的解法。数组其实是另外一种形式的二叉树,只不过有时候需要我们动态地把左/右子树给切分出来,不同的切分方式,可以解决不同的问题。

参考

责任编辑:武晓燕 来源: 不爱吃猫的鱼er
相关推荐

2023-01-13 16:53:17

Annotation底层元注解

2020-10-13 11:15:31

三路快排

2023-01-31 09:02:24

JSVMVR

2010-11-23 10:21:53

跳槽

2018-01-10 08:27:00

2020-06-15 09:41:47

网络安全数据技术

2019-03-27 14:20:27

大数据核心价值数据分析

2013-06-27 10:09:21

大数据

2022-06-01 07:10:43

递归字典极限

2010-09-17 16:16:05

无线接入技术

2023-02-25 16:02:48

2020-06-05 08:37:08

Object.entr开发Object.from

2024-04-08 08:37:41

代码githook

2020-08-13 09:55:37

Stream代码Java

2019-06-03 10:14:07

API网关微服务

2021-10-08 21:00:52

数据弱引用对象

2022-06-29 08:32:04

游标MySQL服务器

2022-09-28 18:16:34

JavaJDK

2023-06-30 08:26:24

Java注解Java程序元素

2024-04-07 00:00:00

ESlint命令变量
点赞
收藏

51CTO技术栈公众号