ElasticSearch为什么快？你知道为什么吗？-51CTO.COM

Elasticsearch，开源的分布式搜寻及分析引擎，主要适用于以下场景：

Elasticsearch乃一款高性能、分布式搜索引擎，其速之快者，缘由如下：

综上所述，Elasticsearch之所以这么快，由于其运用多项高效技术，提升数据存储、查询、处理效率，构筑快捷搜索体验。

在Elasticsearch中，倒排索引是一种常见的索引结构，用于快速搜索文档中的特定词汇。

与传统索引结构相反，倒排索引的构建方式不同。传统索引结构是以文档为基础，每个文档包含多个词汇，然后根据这些词汇建立索引。而倒排索引则以词汇为基础，每个词汇对应多个文档，然后根据这些文档建立索引。这种结构使得在搜索过程中能够快速定位包含目标词汇的文档，从而加速搜索效率。

对于一份含有多个词汇的文档，倒排索引将每个词汇视作一个关键字（Term），记录该词汇所属文档的编号（Document ID）以及在文档中的位置（Term Position）。这种方式使得当用户输入关键字时，能够迅速查找到包含该关键字的文档编号，再通过编号找到相应文档内容。

倒排索引的优势在于能迅速锁定含指定关键字的文档，同时支持复杂搜索操作，如词组搜索、通配符搜索等。此外，由于倒排索引以词汇为基础构建，因此在数据分析和统计方面也具备重要意义。在Elasticsearch中，倒排索引是一种至关重要的索引结构，广泛应用于搜索引擎、日志分析、推荐系统等领域。

ES中的倒排索引建立过程主要有2个步骤，分别是分词、建立倒排索引

比如我们现在有三份文档内容，分别是

在倒排索引构建过程中，首先是将文档原始内容分割为词项（Term）。Elasticsearch 默认采用标准分析器（Standard Analyzer）进行分词处理。

经过分词处理后，您提供的三份文档内容将包含诸如"深入"、"理解"、"Java"、"核心"、"技术"、"编程"、"思想"、"周志明"、"布鲁斯·埃克尔"等词语。

生成倒排索引

将分开的词，当做索引，与对应的文档ID进行关联，形成倒排表。

在倒排表生成完毕后，常规操作是对倒排表进行压缩，以减少其空间占用。流行的压缩算法包括Variable Byte Encoding和Simple9等技术。最后，压缩后的倒排表将被存储在磁盘上，以确保日后的搜索过程能够迅速访问倒排表。