系统页面缓存也会影响数据库的运行性能,你相信吗?

开发 前端
开源数据库的存储层,往往都建立在 OS 的文件系统之上。这时候,数据库用户需要意识到,系统缓存也会对数据库运行性能产生影响。

 本文转载自微信公众号「红石PG」,作者红石PG

介绍

您有没有遇到这样的问题:已经重启了 PostgreSQL 服务器,但是第二次运行同样的查询仍然快得多,这是为什么?

这个问题的答案很简单,因为重新启动数据库服务器只会清除数据库缓冲区的缓存,但是其他缓存没有变化,这些缓存是:

缓冲区缓存 - PostgreSQL 从磁盘加载包含表和索引的页面的共享缓冲池,以直接从内存工作,从而减少磁盘访问。

页面缓存 - 操作系统通常会缓存文件 IO,除非您通过使用 O_DIRECT 标志,或者以直接 IO 模式挂载文件系统,来显式跳过页面缓存。

硬件缓存 - CPU 状态缓存可能会轻微地影响到查询执行速度,但硬件 IO 缓存可能会造成巨大影响。其中一个是硬件 RAID 缓存,但更重要的是 SAN 缓存,它可能影响非常大。

准备工作

让我们通过一个示例来更好地了解,页面缓存会如何影响查询性能。

假设我们有一个名为t1的表:

CREATE TABLE t1 (id integer, str text);

下面是用于生成数据的示例 SQL 查询:

我们已经给此表填充了数百万行示例数据。

页面缓存示例

在我们观察页面缓存对查询性能的影响之前,我们需要先停止 PostgreSQL 服务器,首先以 root 帐户清理系统页面缓存:

# echo 3 > /proc/sys/vm/drop_caches

然后,启动 PostgreSQL 服务器。

现在,假设我们要检索总共的记录数:

SET max_parallel_workers_per_gather TO 0;
PLAIN (analyze, buffers) SELECT count(*) FROM t1;
                                                     QUERY PLAN
--------------------------------------------------------------------------------------------------------------------
 Aggregate  (cost=32909.00..32909.01 rows=1 width=8) (actual time=439.977..439.978 rows=1 loops=1)
   Buffers: shared read=20409
   ->  Seq Scan on t1  (cost=0.00..30409.00 rows=1000000 width=0) (actual time=0.244..349.652 rows=1000000 loops=1)
         Buffers: shared read=20409
 Planning:
   Buffers: shared hit=13 read=6
 Planning Time: 3.522 ms
 Execution Time: 440.979 ms
(8 rows)

表现很好。让我们重新启动 PostgreSQL 服务器。

实际上,我们可以通过 pgfincore 来查看页面缓存的统计信息。

现在,让我们再次检索记录总数,看看它会如何影响性能:

SET max_parallel_workers_per_gather TO 0;

EXPLAIN (analyze, buffers) SELECT count(*) FROM t1;
                                                     QUERY PLAN
--------------------------------------------------------------------------------------------------------------------
 Aggregate  (cost=32909.00..32909.01 rows=1 width=8) (actual time=199.904..199.906 rows=1 loops=1)
   Buffers: shared read=20409
   ->  Seq Scan on t1  (cost=0.00..30409.00 rows=1000000 width=0) (actual time=1.131..113.739 rows=1000000 loops=1)
         Buffers: shared read=20409
 Planning:
   Buffers: shared hit=13 read=6
 Planning Time: 0.413 ms
 Execution Time: 199.955 ms
(8 rows)

现在查询性能明显更好。我们已将执行时间缩短了两倍以上!

责任编辑:武晓燕 来源: 红石PG
相关推荐

2024-03-13 10:40:00

性能探测工具SQL语句数据库

2010-11-26 14:52:10

MySQL系统变量

2024-01-02 08:55:27

Linux缓存系统性能

2023-12-28 07:35:44

数据库场景Object

2012-02-16 09:53:50

2021-09-12 17:25:12

SQLite数据库

2021-12-10 07:47:31

MySQL设置数据库

2021-07-01 10:45:08

硬盘数据库性能

2010-06-17 13:34:47

SQL Server数

2024-05-31 13:04:09

2009-06-30 15:02:41

磁盘排序Oracle数据库性能

2010-05-10 09:48:16

SQL Server数

2010-04-21 14:00:48

Oracle数据库

2019-03-07 15:06:48

MySQL数据库数据库优化

2018-09-08 09:46:06

数据库性能优化

2021-08-19 15:36:09

数据备份存储备份策略

2022-05-09 07:49:47

PulsarJava问题排查

2015-04-22 14:41:04

云迁移Redis缓存数据模型调整

2018-03-27 08:46:01

数据库NoSQLredis

2010-08-30 14:31:43

Cache
点赞
收藏

51CTO技术栈公众号