一篇学会 Rust 内存布局

开发 前端
union的内存大小是其成员中最大的那个成员的大小,类似的,对于Data这个Enum类型,会选择最大的那个成员的大小所以24+tag的8字节,最终为32字节 (tag在这里就用来标识其为i32,还是f64,或者是Vec)。

图片图片

题图忘了来自哪里..

整型,浮点型,struct,vec!,enum

本文是对 Rust内存布局[1] 的学习与记录

struct A {
    a: i64,
    b: u64,
}

struct B {
    a: i32,
    b: u64,
}

struct C {
    a: i64,
    b: u64,
    c: i32,
}

struct D {
    a: i32,
    b: u64,
    c: i32,
    d: u64,
}

fn main() {
    println!("i32类型占的内存空间为:{}字节", std::mem::size_of::<i32>());
    println!("i64类型占的内存空间为:{}字节", std::mem::size_of::<i64>());
    println!(
        "[i64;4]占的内存空间为:{}字节",
        std::mem::size_of::<[i64; 4]>()
    );

    println!("结构体A占的内存空间为:{}字节", std::mem::size_of::<A>());
    println!("结构体B占的内存空间为:{}字节", std::mem::size_of::<B>());
    println!("结构体C占的内存空间为:{}字节", std::mem::size_of::<C>());
    println!("结构体D占的内存空间为:{}字节", std::mem::size_of::<D>());
}

输出

i32类型占的内存空间为:4字节
i64类型占的内存空间为:8字节
[i64;4]占的内存空间为:32字节
结构体A占的内存空间为:16字节
结构体B占的内存空间为:16字节
结构体C占的内存空间为:24字节
结构体D占的内存空间为:24字节

没啥好说的,和Go一样,struct会存在内存对齐/内存填充(8字节对齐)

D是因为编译器会优化内存布局,字段顺序重排

Rust中的Vec!和Go中的slice差不多,都是占24Byte,三个字段

struct SimpleVec<T> {
    len: usize,      // 8
    capacity: usize, //8
    data: *mut T,    //8
}

fn main() {
    println!(
        "Vec!类型占的内存空间为:{}字节",
        std::mem::size_of::<SimpleVec<i32>>()
    );

    println!(
        "Option<i64>类型占的内存空间为:{}字节",
        std::mem::size_of::<Option<i64>>()
    );
}
Vec!类型占的内存空间为:24字节
Option<i64>类型占的内存空间为:16字节

但是对于enum类型,

会有一个tag字段,uint64,来标记变体,是None值还是Some值

struct Option {
    uint64 tag; // 占8字节 Some None
    i64; //实际存放的数据
}

struct SimpleVec<T> {
    len: usize,      // 8
    capacity: usize, //8
    data: *mut T,    //8
}

enum Data {
    // tag,uint64,8字节
    I32(i32),             //  4字节,但需内存对齐到8字节?
    F64(f64),             // 8字节
    Bytes(SimpleVec<u8>), // 24字节
}

fn main() {
    println!(
        "Data这个Enum类型占的内存空间为:{}字节",
        std::mem::size_of::<Data>()
    );
}

输出为:

Data这个Enum类型占的内存空间为:32字节

Rust的enum类似C++ std::variant的实现(大致是用union实现的)

union的内存大小是其成员中最大的那个成员的大小,

类似的,对于Data这个Enum类型,会选择最大的那个成员的大小

所以24+tag的8字节,最终为32字节 (tag在这里就用来标识其为i32,还是f64,或者是Vec)

嵌套的枚举:

struct SimpleVec<T> {
    len: usize,      // 8
    capacity: usize, //8
    data: *mut T,    //8
}

enum Data {
    // tag,uint64,8字节
    I32(i32),             //  4字节,但需内存对齐到8字节?
    F64(f64),             // 8字节
    Bytes(SimpleVec<u8>), // 24字节
}

type OptData = Option<Data>;

fn main() {
    println!(
        "OptData这个Option类型占的内存空间为:{}字节",
        std::mem::size_of::<OptData>()
    );
}

输出:

OptData这个Option类型占的内存空间为:32字节

因为编译器会对嵌套的枚举类型进行优化,会将其tag展开, 把多个tag合在一起了,类似下面:

展开变成一个枚举(None是uint64,能标识非常多信息)

type OptData = Option<Data>;

enum Option {
    Some,
    None,
}

enum OptData_ {
    I32(i32);
    F64(f64);
    Bytes(SimpleVec<u8>),
    None
}

元组tuple

rust中的元组大小固定吗?

在Rust中,元组的大小是固定的。这里解释一下元组大小固定的含义:

  • 元组中的元素类型和数量在编译期就已经确定,不能在运行期修改。
  • 编译器会根据元组中元素的类型,预先分配足够的内存用于存储这些元素。
  • 元组的内存布局和大小也在编译期就确定下来了,运行期不会改变。
  • 尝试创建包含不同类型或数量元素的元组,是编译时错误。

举个例子:

let tuple = (1, 2.0, "three");

这里元组包含一个i32,一个f64和一个字符串。编译器会预先知道:

  • 元组元素类型为i32, f64, &str
  • i32占用4字节,f64占用8字节,&str占据一个指针的空间
  • 所以该元组占用的内存大小为4 + 8 + 8 = 20字节

这20字节的内存在编译时就已分配,运行期不会改变。

如果后续试图给这个元组添加或减少元素,编译都会报错。

所以说,元组的大小和内容是固定的,这是Rust实现方式的一部分。

更多可参考Rust 数据内存布局[2]

参考资料

[1]Rust内存布局: https://www.bilibili.com/video/BV1Bm4y1c71r

[2]Rust 数据内存布局: https://blog.csdn.net/techdashen/article/details/120257323

责任编辑:武晓燕 来源: 旅途散记
相关推荐

2022-02-07 11:01:23

ZooKeeper

2022-01-02 08:43:46

Python

2021-10-18 10:54:48

.NET内存管理

2022-04-12 08:30:52

回调函数代码调试

2021-10-27 09:59:35

存储

2021-07-16 22:43:10

Go并发Golang

2021-09-28 08:59:30

复原IP地址

2023-11-01 09:07:01

Spring装配源码

2021-07-02 08:51:29

源码参数Thread

2023-03-13 21:38:08

TCP数据IP地址

2022-10-20 07:39:26

2021-10-29 07:35:32

Linux 命令系统

2022-03-11 10:21:30

IO系统日志

2021-04-29 10:18:18

循环依赖数组

2022-11-14 08:17:56

2021-10-14 10:22:19

逃逸JVM性能

2021-05-11 08:54:59

建造者模式设计

2021-07-06 08:59:18

抽象工厂模式

2023-01-03 08:31:54

Spring读取器配置

2021-07-02 09:45:29

MySQL InnoDB数据
点赞
收藏

51CTO技术栈公众号