在StackOverflow 上看到2024年技术趋势,关于数据库的部分,PostgreSQL 是开发人员使用最多的数据库,超过 MySQL 了。虽然在国内好像不是这样。
图片
PostgreSQL 在 2018 年的开发者调查中首次亮相,当时有 33% 的开发者正在使用它。而当年最受欢迎的还是 MySQL,有 59% 的开发者在使用。而六年后的今天,49% 的开发人员使用 PostgreSQL,连续第二年成为最受欢迎的数据库。
PostgreSQL 是什么
PostgreSQL 的历史可以追溯到加利福尼亚大学伯克利分校的 Ingres 项目。1985年,开始了以 post-Ingres 计划为原型进行研发,也就是 Postgres 的最初是版本。
图片
其目的是通过增加最少的功能来完全支持所需要的类型。
这些功能包括类型定义和完整描述数据关系的能力。完整描述数据关系的能力之前虽广为使用但却需要由用户来维护。Postgres的数据库能够"理解"关系,并可以使用一定的规则以自然方式在相关的表中检索信息。
直到 1994年,Postgres95 增加了 SQL 语言解释器,后在1996年更名为 PostgreSQL。
PostgreSQL 和 MySQL 一样,也是完全开源的,也是一个关系型数据库。
作为一个优秀的关系型数据库,PostgreSQL 支持这么多特性,怪不得现在使用的人这么多。
- 支持自定义数据类型和继承,允许用户定义新的类型和基于现有类型的子类型。
- 支持多种编程语言编写的函数,包括 PL/pgSQL、PL/Perl、PL/Python 等。
- 提供了自定义索引方法,包括 B树、哈希表和 GiST 索引。
- 支持多版本并发控制(MVCC),减少了读取锁的依赖,提高了并发性能。
- 支持规则(RULE),允许查询重写,常用于视图操作。
- 内置丰富的数据类型,如任意精度数值、无限制长度文本、几何图元、IP地址、数组、JSON数据、枚举类型和 XML 数据。
- 支持用户定义对象,如索引、操作符、聚合函数、数据域、数据类型转换和会话。
- 支持继承,允许数据表结构和属性从一个“父”表继承。
- 支持关系完整性约束、视图、内外部连接、子查询、事务处理等。
- 支持 SSL 加密连接、二进制/文本大对象存储、在线备份、数据域、表分区、表空间、保存点、时刻点恢复、二阶段提交等。
- 支持 TOAST 技术,用于存储超大属性。
看上去是完全覆盖 MySQL 的功能的,就比如 PostgreSQL 是直接支持数组类型的,而 MySQL 中你就要转一下。
PostgreSQL和MySQL的区别
这两个数据库接的头两把交椅之间有什么区别呢?
数据一致性和事务处理
PostgreSQL 和MySQL 都实现了完整的ACID特性(原子性、一致性、隔离性、持久性),并且采用了多版本并发控制(MVCC)来管理事务。
MySQL的默认存储引擎MyISAM曾经不支持事务,但是现在InnoDB已经成为MySQL的默认引擎,并且支持事务了。
但是其在处理复杂事务时的性能和一致性仍然不如PostgreSQL稳健。
扩展性和灵活性
PostgreSQL 扩展性和灵活性是非常强大的。 开发者可以使用PostgreSQL自定义数据类型、操作符、索引方法,甚至编写存储过程和触发器来扩展数据库的功能。
而MySQL虽然也支持一些扩展功能,但相比之下,它的灵活性较为有限。MySQL的设计更注重易用性和性能优化,但这也使得它在处理复杂数据类型和自定义需求时显得有些捉襟见肘。
性能方面
在性能上,MySQL的优势在于其读写性能,尤其是在处理大量简单查询时,MySQL的速度非常快。这使得MySQL成为了许多Web应用的首选,尤其是那些以读取为主的应用。
而PostgreSQL则在处理复杂查询和大数据集时表现优异。PostgreSQL的查询优化器非常强大,它能够对复杂的SQL查询进行优化,确保在高负载下依然保持出色的性能。对于那些需要执行大量数据分析、数据聚合的应用来说,PostgreSQL无疑是更好的选择。
数据库引擎和存储
MySQL最大的特点之一是它支持多种存储引擎,如InnoDB、MyISAM。开发者可以根据需求选择最适合的引擎,例如InnoDB提供了事务支持和外键约束,而MyISAM则在读取性能上更具优势。
而PostgreSQL采用统一的存储架构,所有数据都存储在一个共享的存储引擎中。这种设计保证了数据的一致性和完整性,同时也简化了开发和运维的工作。虽然没有MySQL那样多样的选择,但PostgreSQL凭借其强大的功能和灵活性,依然能够满足大多数应用场景的需求。
PostgreSQL 更受欢迎的原因
看过上面,好像也没有看出PostgreSQL 比 MySQL 强在哪里啊,那为什么却超越了MySQL,成为最受欢迎的数据库了呢?
原因是以下几个方面:
数据完整性和可靠性
PostgreSQL在数据完整性和可靠性方面的优势是它获得青睐的重要原因之一。
PostgreSQL的设计理念一直是优先考虑数据的准确性和完整性,而不是牺牲这些特性来换取性能。这一点对于那些需要高数据一致性的应用来说至关重要,比如金融行业、政府机构和医疗领域。
强大的查询能力
在处理复杂查询时,PostgreSQL的表现远超MySQL。
其优化器可以处理非常复杂的SQL查询,包括子查询、联接和窗口函数等。PostgreSQL还支持丰富的索引类型,如B树、哈希、GiST、GIN、BRIN等,这使得它在大数据集上的查询性能非常出色。
对于需要进行复杂数据分析和实时决策支持的企业来说,PostgreSQL是一个理想的选择。
扩展性和自定义能力
PostgreSQL的扩展能力是它能够脱颖而出的另一个关键因素。开发者可以根据业务需求,对PostgreSQL进行深度定制,添加自定义的数据类型、函数、操作符,甚至是索引方式。
这种灵活性使得PostgreSQL能够适应各种复杂的业务场景,从而赢得了众多企业的青睐。
举个例子,许多使用地理信息系统(GIS)的公司都选择PostgreSQL,因为它可以通过PostGIS扩展,提供强大的空间数据处理能力。
类似地,许多大数据处理和分析系统也选择了PostgreSQL,因为它可以通过自定义扩展来优化查询和数据处理流程。
高标准的SQL兼容性
PostgreSQL一直以来都以严格遵循SQL标准而著称,这使得它在需要与其他数据库系统兼容或迁移数据时非常方便。MySQL虽然在功能上也在不断追赶,但在SQL标准的兼容性上,PostgreSQL依然保持领先。
此外,PostgreSQL还支持丰富的数据类型,包括数组、JSON、XML等,甚至可以存储和查询地理空间数据。对于那些需要处理非结构化数据或复杂数据类型的应用来说,PostgreSQL无疑提供了更多的选择和更大的灵活性。
云原生和大数据支持
随着云计算和大数据技术的快速发展,PostgreSQL的高扩展性和分布式处理能力使其在云原生应用中表现出色。许多云服务提供商,如AWS、Google Cloud和Azure,都提供了托管的PostgreSQL服务,这让开发者可以轻松地将PostgreSQL集成到他们的云应用中。
此外,PostgreSQL还支持分布式数据库和并行查询,这使得它在处理大规模数据集和高并发场景时,依然能够保持良好的性能和稳定性。这一点对于那些需要处理海量数据的互联网公司来说尤为重要。
但是国内云平台还是应用 MySQL 的更多一些。
开源精神和社区支持
PostgreSQL的开源精神和强大的社区支持也是它获得广泛认可的重要原因。与某些开源项目不同,PostgreSQL始终坚持完全开源,没有分割成商业版本和开源版本。这种透明和开放的开发模式吸引了全球无数的开发者和企业用户参与到PostgreSQL的社区中来。
PostgreSQL社区非常活跃,经常发布新的版本和功能,不断提升数据库的性能和稳定性。同时,社区中也有大量的教程、文档和工具可以帮助开发者更快地上手和使用PostgreSQL。