Go 数组比切片好在哪?

开发 后端
Go 语言中有一种基本数据类型,叫数组。其格式为:[n]T。是一个包含 N 个类型 T 的值的数组。

[[398985]]

本文转载自微信公众号「脑子进煎鱼了」,作者陈煎鱼。转载本文请联系脑子进煎鱼了公众号。

大家好,我是煎鱼。

前段时间有播放一条快讯,就是 Go1.17 会正式支持切片(Slice)转换到数据(Array),不再需要用以前那种骚办法了,安全了许多。

但是也有同学提出了新的疑惑,在 Go 语言中,数组其实是用的相对较少的,甚至会有同学认为在 Go 里可以把数组给去掉。

数组相较切片到底有什么优势,我们又应该在什么场景下使用呢?

这是一个我们需要深究的问题,因此今天就跟大家一起来一探究竟,本文会先简单介绍数组和切片是什么,再进一步对数组的使用场景剖析。

一起愉快地开始吸鱼之路。

数组是什么

Go 语言中有一种基本数据类型,叫数组。其格式为:[n]T。是一个包含 N 个类型 T 的值的数组。

基本声明格式为:

  1. var a [10]int 

代表的是声明了一个变量 a 是一个包含 10 个整数的数组。数组的长度是其类型的一部分,所以数组不能被随意调整大小。

在使用例子上:

  1. func main() { 
  2.  var a [2]string 
  3.  a[0] = "脑子进" 
  4.  a[1] = "煎鱼了" 
  5.  fmt.Println(a[0], a[1]) 
  6.  fmt.Println(a) 
  7.  
  8.  primes := [6]int{2, 3, 5, 7, 11, 13} 
  9.  fmt.Println(primes) 

输出结果:

  1. 脑子进 煎鱼了 
  2. [脑子进 煎鱼了] 
  3. [2 3 5 7 11 13] 

在赋值和访问上,数组可以针对不同的索引,进行单独操作。在内存布局上,数组的索引 0 和 1...是会在相邻区域,可直接访问。

切片是什么

为什么数组在业务代码似乎用的很少。因为 Go 语言有一个切片的数据类型:

基本声明格式为:

  1. var a []T 

代表的是变量 a 是带有类型元素的切片T。通过指定两个索引(下限和上限)并用冒号隔开来形成切片:

  1. a[low : high] 

在使用例子上:

  1. func main() { 
  2.  primes := [3]string{"煎鱼""搞""Go"
  3.  
  4.  var s []string = primes[1:3] 
  5.  fmt.Println(s) 

输出结果:

  1. [搞 Go] 

切片支持动态的扩缩容,不需要用户侧去关注,非常便利。更重要的一点是,切片的底层数据结构中本身就包含了数组:

  1. type slice struct { 
  2.  array unsafe.Pointer 
  3.  len   int 
  4.  cap   int 

也就很多人笑称:在 Go 语言中数组已经可以下岗了,用切片就完事了...

你怎么看待这个说法的呢,快速思考你心中的答案。

数组的优势

在风尘仆仆介绍完数组和切片的基本场景后,在数组的优势方面,先了解一下官方的自述:

Arrays are useful when planning the detailed layout of memory and sometimes can help avoid allocation, but primarily they are a building block for slices.

非常粗暴间接:在规划内存的详细布局时,数组是很有用的,有时可以帮助避免分配,但主要是它们是分片的构建块。

我们再进一步解读,看看官方这股 “密文” 具体指的是什么,我们将该密文解读为以下内容进行讲解:

  • 可比较。
  • 编译安全。
  • 长度是类型。
  • 规划内存布局。
  • 访问速度。

可比较

数组是固定长度的,它们之间是可以进行比较的,数组是值对象(不是引用或指针类型),你不会遇到 interface 等比较的误判:

  1. func main() { 
  2.  a1 := [3]string{"脑子""进""煎鱼了"
  3.  a2 := [3]string{"煎鱼""进""脑子了"
  4.  a3 := [3]string{"脑子""进""煎鱼了"
  5.  
  6.  fmt.Println(a1 == a2, a1 == a3) 

输出结果:

  1. false true 

另一方面,切片不可以直接比较,也不能用于判断:

  1. func main() { 
  2.  a1 := []string{"脑子""进""煎鱼了"
  3.  a2 := []string{"煎鱼""进""脑子了"
  4.  a3 := []string{"脑子""进""煎鱼了"
  5.  
  6.  fmt.Println(a1 == a2, a1 == a3) 

输出结果:

  1. # command-line-arguments 
  2. ./main.go:10:17: invalid operation: a1 == a2 (slice can only be compared to nil) 
  3. ./main.go:10:27: invalid operation: a1 == a3 (slice can only be compared to nil) 

同时数组可以作为 map 的 k(键),而切片不行,切片并没有实现平等运算符(equality operator),需要考虑的问题有非常多,例如:

  • 涉及浅层与深层比较。
  • 指针与值比较。
  • 如何处理递归类型。

平等是为结构体和数组定义的,所以这类类型可以作为 map 键使用。切片没有平等的定义,有着非常根本的差距。

数组的可比较和平等,切片做不到。

编译安全

数组可以提供更高的编译时安全,可以在编译时检查索引范围。如下:

  1. s := make([]int, 3) 
  2. s[3] = 3 // "Only" a runtime panic: runtime error: index out of range 
  3.  
  4. a := [3]int{} 
  5. a[3] = 3 // Compile-time error: invalid array index 3 (out of bounds for 3-element array) 

这个编译检查的帮助虽 “小”,但其实非常有意义。我是日常看到各大切片越界的告警,感觉都能背下来了...

万一这个越界是在 hot path 上,影响大量用户,分分钟背个事故,再来个 3.25,岂不梦中惊醒?

数组的编译安全,切片做不到。

长度是类型

数组的长度是数组类型声明的一部分,因此长度不同的数组是不同的类型,两个就不是一个 “东西”。

当然,这是一把双刃剑。其优势在于:可用于显式指定所需数组的长度。

例如:你在业务代码中想编写一个使用 IPv4 地址的函数。可以声明 type [4]byte。使用数组有以下意识:

有了编译时的保证,也就是达到传递给你的函数的值将恰好具有4个字节,不多也不少的效果。

如果长度不对,也就可以认为是无效的 IPv4 地址,非常方便。

同时数组的长度,也可以用做记录目的:

MD5 类型,在 crypto/md5包中,md5.Sum 方法返回类型为的值,[Size]byte 其中 md5.Size 一个常量为16:MD5 校验和的长度。

IPv4 类型,所声明的 [4]byte 正确记录了有 4 个字节。

RGB 类型,所声明的 [3]byte 告诉有对每个颜色成分 1 个字节。

在特定业务场景上,使用数组更好。

规划内存布局

数组可以更好地控制内存布局,因为不能直接在带有切片的结构中分配空间,所以可以使用数组来解决。

例如:

  1. type Foo struct { 
  2.     buf [64]byte 

不知道你是否有在一些 Go 图形库上见过这种不明所以的操作,例子如下:

  1. type TGIHeader struct { 
  2.     _        uint16 // Reserved 
  3.     _        uint16 // Reserved 
  4.     Width    uint32 
  5.     Height   uint32 
  6.     _        [15]uint32 // 15 "don't care" dwords 
  7.     SaveTime int64 

因为业务需求,我们需要实现一个格式,其中格式是 "TGI"(理论上的Go Image),头包含这样的字段:

  • 有 2 个保留字(每个16位)。
  • 有 1 个字的图像宽度。
  • 有 1 个字的图像高度。
  • 有 15 个业务 "不在乎 "的字节。
  • 有 1 个保存时间,图像的保存时间为8字节,是自1970年1月1日UTC以来的纳秒数。

这么一看,也就不难理解数组的在这个场景下的优势了。定长,可控的内存,在计划内存布局时非常有用。

访问速度

使用数组时,其访问(单个)数组元素比访问切片元素更高效,时间复杂度是 O(1)。例如:

  1. var a [2]string 
  2. a[0] = "脑子进" 
  3. a[1] = "煎鱼了" 
  4. fmt.Println(a[0], a[1]) 

切片就没那么方便了,访问某个位置上的索引值,需要:

  1. var a []int{0, 1, 2, 3, 4, 5}   
  2.  number := numbers[1:3] 

相对复杂些的,删除指定索引位上的值,可能还有小伙伴纠结半天,甚至在找第三方开源库想快速实现。

无论在访问速度和开发效率上,数组都占一定的优势,这是切片所无法直接对比的。

总结

经过一轮的探讨,我们对 Go 语言的数组有了更深入的理解。总结如下:

数组是值对象,可以进行比较,可以将数组用作 map 的映射键。而这些,切片都不可以,不能比较,无法作为 map 的映射键。

数组有编译安全的检查,可以在早起就避免越界行为。切片是在运行时会出现越界的 panic,阶段不同。

数组可以更好地控制内存布局,若拿切片替换,会发现不能直接在带有切片的结构中分配空间,数组可以。

数组在访问单个元素时,性能比切片好。

数组的长度,是类型的一部分。在特定场景下具有一定的意义。

数组是切片的基础,每个数组都可以是一个切片,但并非每个切片都可以是一个数组。如果值是固定大小,可以通过使用数组来获得较小的性能提升(至少节省 slice 头占用的空间)。

与你心目中的数组的优势是否一致呢,欢迎大家在评论区进行讨论和交流。

我是煎鱼,咱们下期再见:)

参考

In GO programming language what are the benefits of using Arrays over Slices?

 

Why have arrays in Go?

 

责任编辑:武晓燕 来源: 脑子进煎鱼了
相关推荐

2022-06-02 13:54:04

Go数组切片

2023-03-29 08:03:53

2024-06-13 09:10:22

2021-07-13 06:44:04

Go语言数组

2010-06-23 09:41:17

Amazon Simp

2019-09-26 11:04:39

电脑硬件配置

2012-10-26 15:50:02

Windows 8微软

2024-09-03 10:56:49

线程AQS

2022-07-27 14:53:51

Windows 11微软游戏

2018-08-16 18:38:00

外设

2024-10-15 08:57:08

Go语言切片

2021-04-09 10:38:59

Go 语言数组与切片

2023-12-27 08:12:04

切片Go语言

2024-05-17 08:47:33

数组切片元素

2018-03-07 15:19:07

2018-01-23 11:42:50

程序员编程代码

2024-09-03 08:06:30

AQS线程代码

2021-08-05 06:54:05

Go切片数据

2023-04-03 08:02:16

切片扩容GO

2024-01-09 16:14:39

RustGo切片
点赞
收藏

51CTO技术栈公众号