如何在Django中使用ElasticSearch

系统 Linux
Elasticsearch可以使我们快速,近乎实时地存储,搜索和分析大量数据,并在几毫秒内给出答复。之所以能够获得快速的搜索响应,是因为它可以直接搜索索引,而不是直接搜索文本。

 什么是Elasticsearch?

Elasticsearch是基于Lucene库的搜索引擎。它提供了具有HTTP Web界面和无模式JSON文档的分布式,多租户功能的全文本搜索引擎。Elasticsearch是用Java开发的。

Elasticsearch的用途是什么?

Elasticsearch可以使我们快速,近乎实时地存储,搜索和分析大量数据,并在几毫秒内给出答复。之所以能够获得快速的搜索响应,是因为它可以直接搜索索引,而不是直接搜索文本。

Elasticsearch-一些基本概念

索引—不同类型的文档和文档属性的集合。例如,文档集可以包含社交网络应用程序的数据。

类型/映射-共享共享同一索引中存在的一组公共字段的文档集合。例如,索引包含社交网络应用程序的数据;对于用户个人资料数据,可以有一种特定的类型,对于消息传递数据,可以有另一种类型,对于注释数据,可以有另一种类型。

文档-以特定方式以JSON格式定义的字段的集合。每个文档都属于一种类型,并且位于索引内。每个文档都与唯一的标识符(称为UID)相关联。

字段-Elasticsearch字段可以包含多个相同类型的值(本质上是一个列表)。另一方面,在SQL中,一列可以恰好包含所述类型的一个值。

在Django中使用Elasticsearch

安装和配置,安装Django Elasticsearch DSL:

  1. $ pip install django-elasticsearch-dsl 

然后将django_elasticsearch_dsl添加到INSTALLED_APPS

必须在django设置中定义ELASTICSEARCH_DSL。

例如: 

  1. ELASTICSEARCH_DSL={  
  2.     'default': {  
  3.         'hosts': 'localhost:9200'  
  4.     },  

声明要索引的数据,然后创建model: 

  1. # models.py  
  2. class Category(models.Model):  
  3.     name = models.CharField(max_length=30 
  4.     desc = models.CharField(max_length=100blank=True 
  5. def __str__(self):  
  6.     return '%s' % (self.name)  
  7. 要使该模型与Elasticsearch一起使用,请创建django_elasticsearch_dsl.Document的子类,在Document类中创建一个Index类以定义我们的Elasticsearch索引,名称,设置等,最后使用Registry.register_document装饰器注册该类。它需要在应用目录中的documents.py中定义Document类。 
  8. # documents.py  
  9. from django_elasticsearch_dsl import Document  
  10. from django_elasticsearch_dsl.registries import registry  
  11. from .models import Category  
  12. @registry.register_document  
  13. class CategoryDocument(Document):  
  14.     class Index:  
  15.         name = 'category'  
  16.     settings = {  
  17.         'number_of_shards': 1,  
  18.         'number_of_replicas': 0  
  19.     }  
  20.     class Django:  
  21.          model = Category  
  22.          fields = [  
  23.              'name',  
  24.              'desc',  
  25.          ]  
  26. 填充:  
  27. 要创建和填充Elasticsearch索引和映射,请使用search_index命令:  
  28. $python manage.py search_index — rebuild  
  29. 要获得更多帮助,请使用命令:  
  30. $ python manage.py search_index —help  
  31. 现在,当执行以下操作时:  
  32. category = Category 
  33.     name="Computer and Accessories" 
  34.     desc="abc desc"  
  35.  
  36. category.save()  
  37. 该对象也将保存在Elasticsearch中(使用信号处理程序)。  
  38. 搜索:  
  39. 要获取elasticsearch-dsl-py搜索实例,请使用:  
  40. s = CategoryDocument.search().filter("term", name="computer" 
  41. # or  
  42. s = CategoryDocument.search().query("match", description="abc" 
  43. for hit in s:  
  44.     print(  
  45.         "Category name : {}, description {}".format(hit.name, hit.desc)  
  46.     )  
  47. 要将弹性搜索结果转换为真实的Django查询集,请注意,这会花费一个SQL请求来检索具有由Elasticsearch查询返回的ID的模型实例。  
  48. s = CategoryDocument.search().filter("term", name="computer")[:30]  
  49. qs = s.to_queryset()  
  50. # qs is just a django queryset and it is called with order_by to keep  
  51. # the same order as the elasticsearch result.  
  52. for cat in qs:  
  53.     print(cat.name)  
  54. 完毕,如果有任何疑问,欢迎留言交流。 

 【编辑推荐】

 

责任编辑:庞桂玉 来源: 马哥Linux运维
相关推荐

2020-12-08 22:07:08

PythonWebDjango

2024-01-30 15:29:20

Django数据库Python

2022-06-23 08:00:53

PythonDateTime模块

2015-08-27 09:46:09

swiftAFNetworkin

2022-05-17 08:25:10

TypeScript接口前端

2011-08-10 09:31:41

Hibernateunion

2021-03-09 07:27:40

Kafka开源分布式

2024-01-18 08:37:33

socketasyncio线程

2020-11-30 11:55:07

Docker命令Linux

2019-09-16 19:00:48

Linux变量

2014-07-02 09:47:06

SwiftCocoaPods

2020-04-09 10:18:51

Bash循环Linux

2024-09-06 11:34:15

RustAI语言

2022-11-18 10:16:26

Linuxwc 命令

2023-01-05 17:13:28

TypeScript泛型组件

2018-06-26 09:15:24

Linux命令history

2018-05-16 10:32:06

Linux命令find

2020-12-31 07:31:10

C# 反射数据

2015-08-31 13:42:06

IDEDockerdoclipser

2023-11-02 11:15:01

容器Kubernetes
点赞
收藏

51CTO技术栈公众号