《深入Rust系统编程》5.2 智能指针与引用计数

January 16, 2025

5.2 智能指针与引用计数

智能指针是 Rust 中用于管理内存的高级工具，它们不仅提供了对内存的所有权管理，还扩展了 Rust 的内存安全机制。智能指针通过封装原始指针并实现 Deref 和 Drop trait，使得开发者能够更安全、更方便地管理内存。引用计数是一种内存管理技术，它通过跟踪值的引用数量来决定何时释放内存。Rust 提供了多种智能指针和引用计数机制，例如 Box、Rc 和 Arc。

5.2.1 智能指针的基本概念

智能指针是一种数据结构，它不仅包含指向数据的指针，还包含额外的元数据和功能。智能指针的主要特点包括：

自动内存管理： 智能指针在离开作用域时会自动释放内存。
所有权管理： 智能指针通过所有权系统确保内存安全。
扩展功能： 智能指针可以提供额外的功能，例如引用计数、线程安全等。

1. `Box<T>`

Box<T> 是 Rust 中最简单的智能指针，它将数据存储在堆上，并在离开作用域时自动释放内存。Box<T> 的主要用途包括：

在堆上分配内存： 当数据大小未知或较大时，可以使用 Box<T> 将数据存储在堆上。
实现递归类型： Rust 需要在编译时知道类型的大小，而递归类型的大小无法在编译时确定。使用 Box<T> 可以将递归类型的大小固定为指针的大小。

以下是一个使用 Box<T> 的示例：

1
2
3
4


fn main() {
    let b = Box::new(5); // 在堆上分配一个整数
    println!("b = {}", b); // 输出 "b = 5"
} // b 离开作用域，内存被释放

2. `Deref` trait

Deref trait 允许智能指针像引用一样使用。通过实现 Deref trait，智能指针可以自动解引用为底层数据。以下是一个自定义智能指针实现 Deref trait 的示例：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25


use std::ops::Deref;

struct MyBox<T>(T);

impl<T> MyBox<T> {
    fn new(x: T) -> MyBox<T> {
        MyBox(x)
    }
}

impl<T> Deref for MyBox<T> {
    type Target = T;

    fn deref(&self) -> &T {
        &self.0
    }
}

fn main() {
    let x = 5;
    let y = MyBox::new(x);

    assert_eq!(5, x);
    assert_eq!(5, *y); // 自动解引用
}

3. `Drop` trait

Drop trait 允许智能指针在离开作用域时执行清理操作。通过实现 Drop trait，智能指针可以自动释放内存或释放其他资源。以下是一个自定义智能指针实现 Drop trait 的示例：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19


struct CustomSmartPointer {
    data: String,
}

impl Drop for CustomSmartPointer {
    fn drop(&mut self) {
        println!("Dropping CustomSmartPointer with data `{}`!", self.data);
    }
}

fn main() {
    let c = CustomSmartPointer {
        data: String::from("my stuff"),
    };
    let d = CustomSmartPointer {
        data: String::from("other stuff"),
    };
    println!("CustomSmartPointers created.");
} // c 和 d 离开作用域，调用 drop 方法

5.2.2 引用计数

引用计数是一种内存管理技术，它通过跟踪值的引用数量来决定何时释放内存。当引用计数为零时，表示没有变量引用该值，内存可以被释放。Rust 提供了两种引用计数智能指针：Rc<T> 和 Arc<T>。

1. `Rc<T>`

Rc<T> 是单线程环境下的引用计数智能指针，它允许多个变量共享同一块内存。Rc<T> 通过克隆（clone）增加引用计数，并在离开作用域时减少引用计数。以下是一个使用 Rc<T> 的示例：

1
2
3
4
5
6
7
8
9


use std::rc::Rc;

fn main() {
    let a = Rc::new(String::from("hello"));
    let b = Rc::clone(&a); // 增加引用计数
    let c = Rc::clone(&a); // 增加引用计数

    println!("a = {}, b = {}, c = {}", a, b, c); // 输出 "a = hello, b = hello, c = hello"
} // a, b, c 离开作用域，引用计数减少，内存被释放

2. `Arc<T>`

Arc<T> 是多线程环境下的引用计数智能指针，它通过原子操作确保线程安全。Arc<T> 的使用方式与 Rc<T> 类似，但适用于并发场景。以下是一个使用 Arc<T> 的示例：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14


use std::sync::Arc;
use std::thread;

fn main() {
    let a = Arc::new(String::from("hello"));
    let b = Arc::clone(&a);
    let c = Arc::clone(&a);

    let handle = thread::spawn(move || {
        println!("a = {}, b = {}, c = {}", a, b, c);
    });

    handle.join().unwrap();
} // a, b, c 离开作用域，引用计数减少，内存被释放

5.2.3 智能指针与引用计数的应用

智能指针和引用计数在 Rust 中有广泛的应用场景，以下是一些常见的应用示例：

1. 实现链表

链表是一种常见的数据结构，但由于其递归特性，需要使用智能指针来实现。以下是一个使用 Box<T> 实现链表的示例：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10


enum List {
    Cons(i32, Box<List>),
    Nil,
}

use List::{Cons, Nil};

fn main() {
    let list = Cons(1, Box::new(Cons(2, Box::new(Cons(3, Box::new(Nil))))));
}

2. 共享数据

在多线程环境中，Arc<T> 可以用于共享数据。以下是一个使用 Arc<T> 和 Mutex<T> 实现线程安全数据共享的示例：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22


use std::sync::{Arc, Mutex};
use std::thread;

fn main() {
    let counter = Arc::new(Mutex::new(0));
    let mut handles = vec![];

    for _ in 0..10 {
        let counter = Arc::clone(&counter);
        let handle = thread::spawn(move || {
            let mut num = counter.lock().unwrap();
            *num += 1;
        });
        handles.push(handle);
    }

    for handle in handles {
        handle.join().unwrap();
    }

    println!("Result: {}", *counter.lock().unwrap()); // 输出 "Result: 10"
}

3. 实现图结构

图结构是一种复杂的数据结构，通常需要使用引用计数来管理节点之间的关系。以下是一个使用 Rc<T> 和 RefCell<T> 实现图结构的示例：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33


use std::rc::Rc;
use std::cell::RefCell;

#[derive(Debug)]
struct Node {
    value: i32,
    edges: Vec<Rc<RefCell<Node>>>,
}

impl Node {
    fn new(value: i32) -> Rc<RefCell<Self>> {
        Rc::new(RefCell::new(Node {
            value,
            edges: Vec::new(),
        }))
    }

    fn add_edge(&mut self, node: Rc<RefCell<Node>>) {
        self.edges.push(node);
    }
}

fn main() {
    let node1 = Node::new(1);
    let node2 = Node::new(2);
    let node3 = Node::new(3);

    node1.borrow_mut().add_edge(Rc::clone(&node2));
    node2.borrow_mut().add_edge(Rc::clone(&node3));
    node3.borrow_mut().add_edge(Rc::clone(&node1));

    println!("{:?}", node1);
}

5.2.4 智能指针与引用计数的性能考虑

智能指针和引用计数虽然提供了便利的内存管理功能，但也带来了一定的性能开销。以下是一些性能优化的建议：

避免过度使用引用计数： 引用计数会增加内存和 CPU 的开销，应尽量避免在性能关键路径中使用。
使用 Rc<T> 和 Arc<T> 时注意循环引用： 循环引用会导致引用计数无法归零，从而引发内存泄漏。可以使用 Weak<T> 来打破循环引用。
选择合适的智能指针： 根据应用场景选择合适的智能指针，例如单线程环境使用 Rc<T>，多线程环境使用 Arc<T>。

5.2.5 总结

智能指针和引用计数是 Rust 中用于管理内存的高级工具，它们通过封装原始指针并实现 Deref 和 Drop trait，使得开发者能够更安全、更方便地管理内存。Box<T> 用于在堆上分配内存，Rc<T> 和 Arc<T> 用于实现引用计数。理解智能指针和引用计数的工作原理，对于编写高效、安全的 Rust 程序至关重要。通过合理地使用智能指针和引用计数，可以构建出高性能、高可靠性的 Rust 应用程序。