Go 内存分配:结构体中的优化技巧

开发 前端
为什么字段c的偏移量是24?字段b中的字符串看起来比16个字节要长得多,如果字符串的偏移量是8,那么字段c的偏移量应该更大一些。

在使用Golang进行内存分配时,我们需要遵循一系列规则。在深入了解这些规则之前,我们需要先了解变量的对齐方式。

Golang的unsafe包中有一个函数Alignof,签名如下:

func Alignof(x ArbitraryType) uintptr

对于任何类型为v的变量x,AlignOf函数会返回该变量的对齐方式。我们将对齐方式记为m。现在,Golang确保m是满足变量x的内存地址 % m == 0的最大可能数,也就是说,变量x的内存地址是m的倍数。

让我们来看看一些数据类型的对齐方式:

  • byte, int8, uint8 -> 1
  • int16, uint16 -> 2
  • int32, uint32, float32, complex64 -> 4
  • int, int64, uint64, float64, complex128 -> 8
  • string, slice -> 8

对于结构体中的字段,行为可能会有所不同,详细信息请参考包的文档。

为了更好地理解结构体内存分配的情况,我们将使用unsafe包中的另一个函数Offsetof。该函数返回字段相对于结构体起始位置的位置,换句话说,它返回字段起始位置与结构体起始位置之间的字节数。

func Offsetof(x ArbitraryType) uintptr

为了更好地理解结构体内存分配,让我们以一个示例结构体为例:

type Example struct {
    a int8
    b string
    c int8
    d int32
}

现在,我们将找出类型为Example的变量所占用的总内存,并尝试优化分配。

var v = Example{
    a: 10,
    b: "Lorem ipsum dolor sit amet, consectetur adipiscing elit. Vivamus rhoncus.",
    c: 20,
    d: 100,
}
fmt.Println("字段a的偏移量:", unsafe.Offsetof(v.a)) // 输出:0
fmt.Println("字段b的偏移量:", unsafe.Offsetof(v.b)) // 输出:8
fmt.Println("字段c的偏移量:", unsafe.Offsetof(v.c)) // 输出:24
fmt.Println("字段d的偏移量:", unsafe.Offsetof(v.d)) // 输出:28

现在,问题出现了:“为什么结构体中字段b的偏移量是8?它应该是1,因为字段a的类型是int8,只占用1个字节。”回到字符串数据类型的对齐方式,它的值为8,这意味着地址需要被8整除,因此在其中插入了7个字节的“填充”,以确保这种行为。

为什么字段c的偏移量是24?字段b中的字符串看起来比16个字节要长得多,如果字符串的偏移量是8,那么字段c的偏移量应该更大一些。

上述问题的答案是,在Go中,字符串并不是在结构体内的同一位置分配内存的。有一个单独的数据结构来保存字符串描述符,并且该字符串描述符以原地方式存储在结构体中,用于类型为string的字段,该描述符的大小为16个字节。

现在,让我们来看看unsafe包中的另一个函数Sizeof。正如其名称所示,该函数估计并返回类型为x的变量所占用的字节数。

注意:它是根据结构体中可能存在的不同大小的字段来估计大小的。

func Sizeof(x ArbitraryType) uintptr

现在,让我们来看看我们的结构体Example的大小。

fmt.Println("Example的大小:", unsafe.Sizeof(v)) // 输出:32

我们如何优化这个结构体以最小化填充呢?

为了优化这个结构体的内存,我们将查看不同数据类型的对齐方式,并尝试减少填充。让我们尝试将两个int8类型的字段放在一起。

type y struct {
    a int8
    c int8
    b string
    d int32
}

var v = y{}
fmt.Println("字段a的偏移量:", unsafe.Offsetof(v.a)) // 输出:0
fmt.Println("字段b的偏移量:", unsafe.Offsetof(v.b)) // 输出:8
fmt.Println("字段c的偏移量:", unsafe.Offsetof(v.c)) // 输出:1
fmt.Println("字段d的偏移量:", unsafe.Offsetof(v.d)) // 输出:24
fmt.Println("Example的大小:", unsafe.Sizeof(v)) // 输出:32

太棒了,我们去掉了一些填充,但是为什么大小仍然是32?大小应该是1(a)+ 1(c)+ 6(填充)+ 16(b)+ 4(d)= 28

现在,当结构体的最后一个字段与架构的对齐要求不完全一致时,会在最后一个字段之后添加填充,以确保结构体的整体大小是其字段中最大对齐要求的倍数。因为字符串数据类型的最大对齐方式为8,所以额外添加了填充,使大小成为8的倍数,即在末尾填充了4个字节,使大小为32字节。

我们能否进一步减少填充,使其更加优化?

让我们尝试通过移动字段位置来实现。

type y struct {
    b string
    d int32
    a int8
    c int8
}

var v = y{}
fmt.Println("字段a的偏移量:", unsafe.Offsetof(v.a)) // 输出:20
fmt.Println("字段b的偏移量:", unsafe.Offsetof(v.b)) // 输出:0
fmt.Println("字段c的偏移量:", unsafe.Offsetof(v.c)) // 输出:21
fmt.Println("字段d的偏移量:", unsafe.Offsetof(v.d)) // 输出:16
fmt.Println("Example的大小:", unsafe.Sizeof(v)) // 输出:24

我们可以看到,通过重新排列字段的位置,使得对齐需要最小化填充,我们已经将结构体的大小从32减小到24,这是内存优化的巨大进步,达到了25%。

当前的内存占用是16(b)+ 4(d)+ 1(a)+ 1(b)+ 2(填充)。

遗憾的是,由于语言和架构的限制,我们无法进一步去除填充。

责任编辑:武晓燕 来源: 爱发白日梦的后端
相关推荐

2021-12-20 07:59:07

Go语言结构体

2020-12-02 09:10:22

Go结构数据类型

2023-07-29 15:03:29

2021-04-20 09:00:48

Go 语言结构体type

2021-02-28 13:22:54

Java内存代码

2021-01-06 09:47:51

内存Go语言

2023-10-10 13:58:00

C语言代码结构体

2010-02-04 14:58:06

C++内存分配

2021-12-21 08:51:13

Go数据Model

2021-11-02 14:54:41

Go结构体标签

2010-08-10 10:17:44

Flex内存

2021-11-02 12:19:18

Go函数结构

2011-08-10 09:06:44

内存内存优化

2023-01-10 09:18:37

Go内存分配逃逸

2020-05-06 18:53:23

Go编程语言

2022-11-30 08:19:15

内存分配Go逃逸分析

2024-01-15 11:12:28

Go内存开发

2020-12-02 08:45:36

Go语言

2020-11-30 06:17:03

Go语言

2020-11-26 06:40:24

Go语言基础
点赞
收藏

51CTO技术栈公众号