概述
在PostgreSQL中,堆元组(Heap Tuple)是表中一行数据的内部表示。每个堆元组都存储在一个页面(通常为8KB)内,并且由三个主要部分组成:HeapTupleHeaderData 结构、空值位图以及用户数据。
详细介绍
1. HeapTupleHeaderData 结构
HeapTupleHeaderData 是元组头部的数据结构,它包含了关于该元组的一些关键信息。这些信息包括事务相关的数据和一些标志位,用于多版本并发控制(MVCC)。
以下是其主要字段:
田 | 类型 | 长度 | 描述 |
t_xmin | 交易 ID | 4 字节 | 插入 XID 图章 |
t_xmax | 交易 ID | 4 字节 | 删除 XID 图章 |
t_cid | CommandId | 4 字节 | 插入和/或删除 CID 图章(与 t_xvac 叠加) |
t_xvac | 交易 ID | 4 字节 | XID 用于 VACUUM 操作移动行版本 |
t_ctid | ItemPointerData (项目指针数据) | 6 字节 | 此行版本或更新行版本的当前 TID |
t_infomask2 | uint16 | 2 字节 | 属性数量,以及各种标志位 |
t_infomask | uint16 | 2 字节 | 各种标志位 |
t_hoff | uint8 | 1 字节 | 用户数据的偏移量 |
2. 空值位图(Null Bitmap)
空值位图是一个可选的部分,仅当表中有允许NULL值的列时存在。这个位图用来标记哪些列的值是NULL。每个位对应一个列,如果某一位被设置,则表示相应的列是NULL。
3. 用户数据(User Data)
用户数据部分包含实际的字段值。这些值按照表定义中列的顺序排列。对于固定长度的数据类型(如int4),直接存储在用户数据部分;对于可变长度的数据类型(如text、varchar),则会有一个长度前缀,随后是实际的数据。
元组增、删、改操作介绍
1. 增(INSERT)操作
假设元组是由 txid=99 的事务插入页面中的,这时被插入元组的首部字段设置如下:
Tuple:
- t_xmin:设置为 99,因为此元组由 txid=99 的事务所插入。
- t_xmax:设置为 0,因为此元组尚未被删除或更新。
- t_cid:设置为 0,因为此元组是由 txid=99 的事务所执行的第一条命令插入的。
- t_ctid:设置为 (0,1),指向自身,因为这是该元组的最新版本。
2. 删(DELETE)操作
图片
假设接下来事务 txid=100 对元组进行了删除操作。此时,删除操作会设置如下:
Tuple(删除后状态):
- t_xmin:保持为 99,表示该元组的插入事务。
- t_xmax:设置为 100,因为此元组现在被 txid=100 的事务删除。
- t_cid:设置为 0,因为删除操作是由 txid=100 事务的第一条命令执行的。
- t_ctid:保持为 (0,1),仍指向原元组。
死元组最终将从页面中被移除。清除死元组的过程被称为清理(VACUUM)过程
3. 改(UPDATE)操作
如果在 txid=101 的事务中,对该元组进行了更新操作。此时,更新操作会创建一个新的元组,且原元组保持不变。新元组的设置如下:
当执行第一条UPDATE命令时,Tuple_1的t_xmax被设为txid 100,在逻辑上被删除,然后Tuple_2被插入,接下来重写Tuple_1的t_ctid以指向Tuple_2。Tuple_1和Tuple_2的头部字段设置如下。
第一条 UPDATE 命令
逻辑删除 Tuple_1:
- Tuple_1 的 t_xmax 被设置为 100(txid)。
- Tuple_1 的 t_ctid 从 (0,1) 改写为 (0,2),指向新插入的元组。
Tuple_1 设置:
- t_xmax: 100、 t_ctid: (0,2)
插入新元组 Tuple_2:
- Tuple_2 的 t_xmin 被设置为 100(当前事务 txid)。
- t_xmax 设置为 0(尚未被删除或更新)。
- t_cid 设置为 0(表示这是该事务的第一条操作)。
- t_ctid 设置为 (0,2)(指向自身)。
Tuple_2 设置:
- t_xmin: 100、t_xmax: 0、t_cid: 0、t_ctid: (0,2)
第二条 UPDATE 命令
逻辑删除 Tuple_2:
- Tuple_2 的 t_xmax 被设置为 100(当前事务 txid)。
- Tuple_2 的 t_ctid 从 (0,2) 改写为 (0,3),指向新插入的元组。
Tuple_2 设置:
- t_xmax: 100、t_ctid: (0,3)
插入新元组 Tuple_3:
- Tuple_3 的 t_xmin 被设置为 100(当前事务 txid)。
- t_xmax 设置为 0(尚未被删除或更新)。
- t_cid 设置为 1(表示这是该事务的第二条操作)。
- t_ctid 设置为 (0,3)(指向自身)。
Tuple_3 设置:
- t_xmin: 100、t_xmax: 0、t_cid: 1、t_ctid: (0,3)
与删除操作类似,如果txid=100的事务已经提交,那么Tuple_1和Tuple_2就成了死元组,而如果txid=100的事务中止,Tuple_2和Tuple_3就成了死元组。
总结
在这个过程中,元组的状态变化如下:
- 插入:新元组的字段由插入事务的 txid 决定。
- 删除:删除操作更新t_xmax,记录删除事务的txid。
- 更新:更新操作创建新的元组,新的 t_xmin 表示更新事务,并且t_cid和t_ctid 反映新的版本信息。