浅析 Go 与 C 的指针

开发 后端
首先数组名 arr 作为一个标识符,是 arr[0] 的地址,从 &arr[0] 的角度去看就是一个指向 int 类型的值的指针。而 &arr 是一个指向 int[5] 类型的值的指针。

 [[426203]]

运算符

C 和 Go 都相同:

  • & 运算符取出变量所在的内存地址
  • * 运算符取出指针变量所指向的内存地址里面的值,也叫 “ 解引用 ”

C 语言版示例:

  1. #include <stdio.h> 
  2.  
  3. int main() 
  4.     int bar = 1; 
  5.     // 声明一个指向 int 类型的值的指针 
  6.     int *ptr; 
  7.     // 通过 & 取出 bar 变量所在的内存地址并赋值给 ptr 指针 
  8.     ptr = &bar; 
  9.     // 打印 ptr 的值(为地址),*prt 表示取出指针变量所指向的内存地址里面的值 
  10.     printf("%p %d\n", ptr, *ptr); 
  11.     return (0); 
  12.  
  13. // 输出结果: 
  14. // 0x7ffd5471ee54 1 

Go 语言版示例:

  1. package main 
  2.  
  3. import "fmt" 
  4.  
  5. func main() { 
  6.  bar := 1 
  7.  // 声明一个指向 int 类型的值的指针 
  8.  var ptr *int 
  9.  // 通过 & 取出 bar 变量所在的内存地址并赋值给 ptr 指针 
  10.  ptr = &bar 
  11.  // 打印 ptr 变量储存的指针地址,*prt 表示取出指针变量所指向的内存地址里面的值 
  12.  fmt.Printf("%p %d\n", ptr, *ptr) 
  13.  
  14. // 输出结果: 
  15. // 0xc000086020 1 

Go 还可以使用 new 关键字来分配内存创建指定类型的指针。

  1. // 声明一个指向 int 类型的值的指针 
  2. // var ptr *int 
  3. ptr := new(int
  4. // 通过 & 取出 bar 变量所在的内存地址并赋值给 ptr 指针 
  5. ptr = &bar 

数组名和数组首地址

对于一个数组

  1. // C 
  2. int arr[5] = {1, 2, 3, 4, 5}; 
  3. // Go 
  4. // 需要指定长度,否则类型为切片 
  5. arr := [5]int{1, 2, 3, 4, 5} 

在 C 中,数组名 arr 代表的是数组首元素的地址,相当于 &arr[0]

而 &arr 代表的是整个数组 arr 的首地址

  1. // C 
  2. // arr 数组名代表数组首元素的地址 
  3. printf("arr -> %p\n", arr); 
  4. // &arr[0] 代表数组首元素的地址 
  5. printf("&arr[0] -> %p\n", &arr[0]); 
  6. // &arr 代表整个数组 arr 的首地址 
  7. printf("&arr -> %p\n", &arr); 
  8.  
  9. // 输出结果: 
  10. // arr -> 0061FF0C 
  11. // &arr[0] -> 0061FF0C 
  12. // &arr -> 0061FF0C 

运行程序可以发现 arr 和 &arr 的输出值是相同的,但是它们的意义完全不同。

首先数组名 arr 作为一个标识符,是 arr[0] 的地址,从 &arr[0] 的角度去看就是一个指向 int 类型的值的指针。

而 &arr 是一个指向 int[5] 类型的值的指针。

可以进一步对其进行指针偏移验证

  1. // C 
  2. // 指针偏移 
  3. printf("arr+1 -> %p\n", arr + 1); 
  4. printf("&arr+1 -> %p\n", &arr + 1); 
  5.  
  6. // 输出结果: 
  7. // arr+1 -> 0061FF10 
  8. // &arr+1 -> 0061FF20 

这里涉及到偏移量的知识:一个类型为 T 的指针的移动,是以 sizeof(T) 为移动单位的。

  • arr+1 : arr 是一个指向 int 类型的值的指针,因此偏移量为 1*sizeof(int)
  • &arr+1 : &arr 是一个指向 int[5] 的指针,它的偏移量为 1*sizeof(int)*5

到这里相信你应该可以理解 C 语言中的 arr 和 &arr 的区别了吧,接下来看看 Go 语言

  1. // 尝试将数组名 arr 作为地址输出 
  2. fmt.Printf("arr -> %p\n", arr) 
  3. fmt.Printf("&arr[0] -> %p\n", &arr[0]) 
  4. fmt.Printf("&arr -> %p\n", &arr) 
  5.  
  6. // 输出结果: 
  7. // arr -> %!p([5]int=[1 2 3 4 5]) 
  8. // &arr[0] -> 0xc00000c300 
  9. // &arr -> 0xc00000c300 

&arr[0] 和 &arr 与 C 语言一致。

但是数组名 arr 在 Go 中已经不是数组首元素的地址了,代表的是整个数组的值,所以输出时会提示 %!p([5]int=[1 2 3 4 5])

指针运算

指针本质上就是一个无符号整数,代表了内存地址。

指针和整数值可以进行加减法运算,比如上文的指针偏移例子:

  • 加n : 一个类型为 T 的指针,以 n*sizeof(T) 为单位向高位移动。
  • 减n : 一个类型为 T 的指针,以 n*sizeof(T) 为单位向低位移动。

其中 sizeof(T) 代表的是数据类型占据的字节,比如 int 在 32 位环境下为 4 字节,64 位环境下为 8 字节

C 语言示例:

  1. #include <stdio.h> 
  2.  
  3. int main() 
  4.     int arr[] = {1, 2, 3, 4, 5}; 
  5.     // ptr 是一个指针,为 arr 数组的第一个元素地址 
  6.     int *ptr = arr; 
  7.     printf("%p %d\n", ptr, *ptr); 
  8.  
  9.     // ptr 指针向高位移动一个单位,移向到 arr 数组第二个元素地址 
  10.     ptr++; 
  11.     printf("%p %d\n", ptr, *ptr); 
  12.     return (0); 
  13.  
  14. // 输出结果: 
  15. // 0061FF08 1 
  16. // 0061FF0C 2 

在这里 ptr++ 从 0061FF08 移动了 sizeof(int) = 4 个字节到 0061FF0C ,指向了下一个数组元素的地址

Go 语言示例:

  1. package main 
  2.  
  3. import "fmt" 
  4.  
  5. func main() { 
  6.  arr := [5]uint32{1, 2, 3, 4, 5} 
  7.  
  8.  // ptr 是一个指针,为 arr 数组的第一个元素地址 
  9.  ptr := &arr[0] 
  10.  fmt.Println(ptr, *ptr) 
  11.  
  12.  // ptr 指针向高位移动一个单位,移向到 arr 数组第二个元素地址 
  13.  ptr++ 
  14.  fmt.Println(ptr, *ptr) 
  15.  
  16. // 输出结果: 
  17. // 编译报错: 
  18. // .\main.go:13:5: invalid operation: ptr++ (non-numeric type *uint32) 

编译报错 *uint32 非数字类型,不支持运算,说明 Go 是不支持指针运算的。

这个其实在 Go Wiki[1] 中的 Go 从 C++ 过渡文档中有提到过:Go has pointers but not pointer arithmetic.

Go 有指针但不支持指针运算。

另辟蹊径

那还有其他办法吗?答案当然是有的。

在 Go 标准库中提供了一个 unsafe 包用于编译阶段绕过 Go 语言的类型系统,直接操作内存。

我们可以利用 unsafe 包来实现指针运算。

  1. func Alignof(x ArbitraryType) uintptr 
  2. func Offsetof(x ArbitraryType) uintptr 
  3. func Sizeof(x ArbitraryType) uintptr 
  4. type ArbitraryType 
  5. func Slice(ptr *ArbitraryType, len IntegerType) []ArbitraryType 
  6. type IntegerType 
  7. type Pointer 
  8. func Add(ptr Pointer, len IntegerType) Pointer 

核心介绍:

  • uintptr : Go 的内置类型。是一个无符号整数,用来存储地址,支持数学运算。常与 unsafe.Pointer 配合做指针运算
  • unsafe.Pointer : 表示指向任意类型的指针,可以和任何类型的指针互相转换(类似 C 语言中的 void* 类型的指针),也可以和 uintptr 互相转换
  • unsafe.Sizeof : 返回操作数在内存中的字节大小,参数可以是任意类型的表达式,例如 fmt.Println(unsafe.Sizeof(uint32(0))) 的结果为 4
  • unsafe.Offsetof : 函数的参数必须是一个字段 x.f,然后返回 f 字段相对于 x 起始地址的偏移量,用于计算结构体成员的偏移量

原理:

Go 的 uintptr 类型存储的是地址,且支持数学运算

*T (任意指针类型) 和 unsafe.Pointer 不能运算,但是 unsafe.Pointer 可以和 *T 、 uintptr 互相转换

因此,将 *T 转换为 unsafe.Pointer 后再转换为 uintptr ,uintptr 进行运算之后重新转换为 unsafe.Pointer => *T 即可

代码实现:

  1. package main 
  2.  
  3. import ( 
  4.  "fmt" 
  5.  "unsafe" 
  6.  
  7. func main() { 
  8.  arr := [5]uint32{1, 2, 3, 4, 5} 
  9.  
  10.  ptr := &arr[0] 
  11.  
  12.  // ptr(*uint32类型) => one(unsafe.Pointer类型) 
  13.  one := unsafe.Pointer(ptr) 
  14.  // one(unsafe.Pointer类型) => *uint32 
  15.  fmt.Println(one, *(*uint32)(one)) 
  16.  
  17.  // one(unsafe.Pointer类型) => one(uintptr类型) 后向高位移动 unsafe.Sizeof(arr[0]) = 4 字节 
  18.  // twoUintptr := uintptr(one) + unsafe.Sizeof(arr[0]) 
  19.  // !!twoUintptr 不能作为临时变量 
  20.  // uintptr 类型的临时变量只是一个无符号整数,并不知道它是一个指针地址,可能被 GC 
  21.  // 运算完成后应该直接转换回 unsafe.Pointer : 
  22.  two := unsafe.Pointer(uintptr(one) + unsafe.Sizeof(arr[0])) 
  23.  fmt.Println(two, *(*uint32)(two)) 
  24.  
  25. // 输出结果: 
  26. // 0xc000012150 1 
  27. // 0xc000012154 2 

甚至还可以更改结构体的私有成员:

  1. // model/model.go 
  2.  
  3. package model 
  4.  
  5. import ( 
  6.  "fmt" 
  7.  
  8. type M struct { 
  9.  foo uint32 
  10.  bar uint32 
  11.  
  12. func (m M) Print() { 
  13.  fmt.Println(m.foo, m.bar) 
  14.  
  15. // main.go 
  16.  
  17. package main 
  18.  
  19. import ( 
  20.  "example/model" 
  21.  "unsafe" 
  22.  
  23. func main() { 
  24.  m := model.M{} 
  25.  m.Print() 
  26.  
  27.  foo := unsafe.Pointer(&m) 
  28.  *(*uint32)(foo) = 1 
  29.  bar := unsafe.Pointer(uintptr(foo) + 4) 
  30.  *(*uint32)(bar) = 2 
  31.  
  32.  m.Print() 
  33.  
  34. // 输出结果: 
  35. // 0 0 
  36. // 1 2 

小 Tips

Go 的底层 slice 切片源码就使用了 unsafe 包

  1. // slice 切片的底层结构 
  2. type slice struct { 
  3.  // 底层是一个数组指针 
  4.  array unsafe.Pointer 
  5.  // 长度 
  6.  len int 
  7.  // 容量 
  8.  cap int 

总结

  • Go 可以使用 & 运算符取地址,也可以使用 new 创建指针
  • Go 的数组名不是首元素地址
  • Go 的指针不支持运算
  • Go 可以使用 unsafe 包打破安全机制来操控指针,但对我们开发者而言,是 "unsafe" 不安全的

参考资料

[1]Go Wiki: https://github.com/golang/go/wiki/GoForCPPProgrammers

本文转载自微信公众号「寻寻觅觅的Gopher」,可以通过以下二维码关注。转载本文请联系寻寻觅觅的Gopher公众号。

 

 

责任编辑:武晓燕 来源: 寻寻觅觅的Gopher
相关推荐

2021-04-13 07:58:42

Go语言函数

2009-08-20 10:25:37

C#操作内存

2009-08-31 15:02:22

C#解析结构体指针

2009-08-13 17:30:30

C#构造函数

2009-09-11 11:16:53

C# Attribut

2024-01-25 11:42:00

C++编程指针常量

2015-05-13 10:37:58

C++指针与引用

2023-12-26 12:13:31

野指针C++编程

2009-09-11 09:20:00

C# button事件

2009-08-03 16:28:53

Java语言与C#语言

2009-08-06 17:57:14

C# webServiC# WebServi

2021-02-05 18:22:51

GoC剖析

2023-10-26 11:19:21

指针Go

2021-01-13 06:58:35

C语言函数指针

2018-11-07 15:12:34

Go-To-Marke市场渠道

2010-01-08 16:00:46

C++编译器

2011-04-11 11:09:50

this指针

2011-06-11 21:36:44

C#C++

2009-11-17 09:07:55

静态构造函数

2009-08-24 14:20:13

C# 强制类型转换
点赞
收藏

51CTO技术栈公众号