大家好,我是渔夫。
今天,让我们一起深入学习 Rust 中的切片。在 Rust 编程语言中,除了常见的 String 类型,还有一种重要的字符串类型:str。这种类型通常被称为字符串切片(slice)。
字符串切片可以理解为对一个字符串的部分或全部的引用。这意味着切片可以有任意长度,它的灵活性在某种程度上与 Golang 语言中的切片相似。
当我们谈论切片的引用时,实际上我们是在引用一种特殊的指针,通常称为“胖指针”。这个指针不仅包含了对数据的引用,还包含了切片的长度信息。
让我们通过下面的代码示例来具体分析这一概念,下面从 String 变量 s 创建了两个切片 s1 和 s2:
fn main() {
let s = String::from("hello");
let s1: &str = &s[0..3];
let s2: &str = &s[3..s.len()];
// 打印出值
println!("s = {}", s);
println!("s1 = {}", s1);
println!("s2 = {}", s2);
// 长度和容量
println!("len = {}", s.len());
println!("capacity = {}", s.capacity());
// 地址
println!("Address of s: {:p}", &s);
println!("Address of s1: {:p}", s1.as_ptr());
println!("Address of s2: {:p}", s2.as_ptr());
}
运行结果:
s = hello
s1 = hel
s2 = lo
len = 5
capacity = 5
Address of s: 0x7ffee307b650
Address of s1: 0x7f8d3ad02ab0
Address of s2: 0x7f8d3ad02ab3
从例子中,可以观察到 s1 和 s2 其实都是s 字符串的切片,是 s 的部分引用,意思就是相当于借用了 s 的部分内存空间。观察这些变量的长度、容量和内存地址揭示了它们之间的关系:尽管 s1 和 s2 有不同的内存地址,但它们是从同一原始字符串 s 中派生出来的。(画好的图,忘记插入了,哈哈)
再打印出 s1 和 s2 的长度:
println!("len = {}", s1.len()); // 3
println!("len = {}", s2.len()); // 2
可以看到切片取值情况:
- &s1:截取从索引 0 到 索引 3
- &s2:从索引 3 开始到索引 5 结束
Go 切片 和 Rust 切片有什么不同
Go 和 Rust 使用“切片”这个词描述不同的概念。在 Go 中,切片结构体既包含长度信息也包含容量信息,它既可以扩展也可以作为现有切片的引用,而无需担心所有权和生命周期。Rust 则将这些功能分离:Vec<T> 是一个可增长的容器,拥有其数据的所有权;而 &[T] 是一个固定大小的切片,只是一个指向数据的借用。
这种区别反映了 Rust 的所有权原则,这在无GC语言语境下提供了内存安全保障。在 Rust 中,所有权、借用和生命周期的概念是核心特性,因此 Vec 和切片必须是两种不同的类型。相反,Go 的类型系统不强制执行这些概念,因为它依赖于垃圾收集器来管理内存。虽然这在概念上似乎更简单,但它也隐藏了潜在的内存管理复杂性。
Rust 之所以将 Go 中的单一切片类型分成 Vec 和切片两种,是为了提供更明确的内存管理语义,减少引用计数导致的性能开销。这些设计决策与 Rust 的目标一致,即提供零成本抽象和更细粒度的内存控制。