Asticsearch 8.x 存储有无压缩?能压缩到多少?

存储 数据管理
默认值使用 LZ4​ 压缩压缩存储的数据,但这可以设置为 best_compression​,它使用 DEFLATE 来获得更高的压缩率,但会降低存储字段的性能。

1、认知前提

Elasticsearch 支持压缩,压缩方式默认为:LZ4 压缩算法。

具体参见:

The default value compresses stored data with LZ4 compression, but this can be set to best_compression which uses DEFLATE for a higher compression ratio, at the expense of slower stored fields performance.

中文翻译为:

默认值使用 LZ4 压缩压缩存储的数据,但这可以设置为 best_compression,它使用 DEFLATE 来获得更高的压缩率,但会降低存储字段的性能。

https://www.elastic.co/guide/en/elasticsearch/reference/8.14/index-modules.html#index-codec

这里要引申一下,这属于:静态配置,类似:number_of_shard 主分片数,不允许动态修改,除非重建索引。

2、动手验证一下压缩比到底能压缩多少?

2.1 样例数据准备

以 kibana_sample_flights 飞行数据为例进行验证。

图片图片

我们直接借助 elasticdump 进行导出,以json 存储,作为原始数据。

导出实现参考:

NODE_TLS_REJECT_UNAUTHORIZED=0 elasticdump \

  --input=https://elastic:@172.121.10.114:9200/kibana_sample_data_flights\

  --output=/www/elasticsearch_0801_20220713/test/flights.json \

  --type=data \

  --input-ca=/www/elasticsearch_0801_20220713/elasticsearch-8.1.0/config/certs/http_ca.crt

导出成功截图:

图片图片

所占存储空间大小:

图片图片

2.2 Elasticsearch 默认 LZ4 压缩算法的存储大小

2.3 如果修改为:best_compression压缩后,所占据存储空间大小如下

需要修改索引:

PUT kibana_sample_data_flights_ext
{
  "settings": {
    "index.codec": "best_compression"

  },

  "mappings": {

    "properties": {
......省略部分映射描述......

然后,reindex 迁移数据。

POST _reindex
{
  "source": {
    "index": "kibana_sample_data_flights"
  },
  "dest": {
    "index": "kibana_sample_data_flights_ext"
  }
}

3、初步结论

图片图片

1)默认压缩LZ4 算法能压缩到一半!54.77%,能节省一半的存储!

新压缩算法 best_compression 压缩后,压缩为原始空间的:35%,也就是能省65%的空间。

压缩比要求高推荐使用:best_compression。

责任编辑:武晓燕 来源: 铭毅天下Elasticsearch
相关推荐

2021-10-12 10:22:33

数据库架构技术

2012-05-03 15:01:24

数值压缩

2024-01-04 07:59:07

Painless脚本数据

2023-08-01 08:44:33

ChatGPTPython脚本

2024-01-30 17:37:50

es集群数据

2014-07-04 10:37:44

Windows 8.xwindows

2018-08-27 10:54:30

C++压缩存储

2018-12-19 13:45:56

Hive实践存储

2014-09-05 14:32:24

操作系统Linux

2010-03-23 09:54:35

好压压缩

2009-08-25 09:42:27

Windows 7系统瘦身

2010-01-04 09:27:31

Linux压缩解压缩命令详解

2023-10-20 13:12:10

Btrfs压缩

2023-12-21 07:30:36

PythonZipfileTarfile

2019-10-11 18:27:18

APK资源压缩

2023-02-26 13:02:19

AI算法技术

2023-08-02 07:21:30

工具搜索排序

2018-09-14 16:18:26

Linux压缩文件应用程序

2009-07-14 11:51:00

XML压缩
点赞
收藏

51CTO技术栈公众号