如何在Django中使用ElasticSearch
什么是Elasticsearch?
Elasticsearch是基于Lucene庫(kù)的搜索引擎。它提供了具有HTTP Web界面和無(wú)模式JSON文檔的分布式,多租戶功能的全文本搜索引擎。Elasticsearch是用Java開(kāi)發(fā)的。
Elasticsearch的用途是什么?
Elasticsearch可以使我們快速,近乎實(shí)時(shí)地存儲(chǔ),搜索和分析大量數(shù)據(jù),并在幾毫秒內(nèi)給出答復(fù)。之所以能夠獲得快速的搜索響應(yīng),是因?yàn)樗梢灾苯铀阉魉饕?,而不是直接搜索文本?/p>
Elasticsearch-一些基本概念
索引—不同類(lèi)型的文檔和文檔屬性的集合。例如,文檔集可以包含社交網(wǎng)絡(luò)應(yīng)用程序的數(shù)據(jù)。
類(lèi)型/映射-共享共享同一索引中存在的一組公共字段的文檔集合。例如,索引包含社交網(wǎng)絡(luò)應(yīng)用程序的數(shù)據(jù);對(duì)于用戶個(gè)人資料數(shù)據(jù),可以有一種特定的類(lèi)型,對(duì)于消息傳遞數(shù)據(jù),可以有另一種類(lèi)型,對(duì)于注釋數(shù)據(jù),可以有另一種類(lèi)型。
文檔-以特定方式以JSON格式定義的字段的集合。每個(gè)文檔都屬于一種類(lèi)型,并且位于索引內(nèi)。每個(gè)文檔都與唯一的標(biāo)識(shí)符(稱為UID)相關(guān)聯(lián)。
字段-Elasticsearch字段可以包含多個(gè)相同類(lèi)型的值(本質(zhì)上是一個(gè)列表)。另一方面,在SQL中,一列可以恰好包含所述類(lèi)型的一個(gè)值。
在Django中使用Elasticsearch
安裝和配置,安裝Django Elasticsearch DSL:
- $ pip install django-elasticsearch-dsl
然后將django_elasticsearch_dsl添加到INSTALLED_APPS
必須在django設(shè)置中定義ELASTICSEARCH_DSL。
例如:
- ELASTICSEARCH_DSL={
- 'default': {
- 'hosts': 'localhost:9200'
- },
- }
聲明要索引的數(shù)據(jù),然后創(chuàng)建model:
- # models.py
- class Category(models.Model):
- name = models.CharField(max_length=30)
- desc = models.CharField(max_length=100, blank=True)
- def __str__(self):
- return '%s' % (self.name)
- 要使該模型與Elasticsearch一起使用,請(qǐng)創(chuàng)建django_elasticsearch_dsl.Document的子類(lèi),在Document類(lèi)中創(chuàng)建一個(gè)Index類(lèi)以定義我們的Elasticsearch索引,名稱,設(shè)置等,最后使用Registry.register_document裝飾器注冊(cè)該類(lèi)。它需要在應(yīng)用目錄中的documents.py中定義Document類(lèi)。
- # documents.py
- from django_elasticsearch_dsl import Document
- from django_elasticsearch_dsl.registries import registry
- from .models import Category
- @registry.register_document
- class CategoryDocument(Document):
- class Index:
- name = 'category'
- settings = {
- 'number_of_shards': 1,
- 'number_of_replicas': 0
- }
- class Django:
- model = Category
- fields = [
- 'name',
- 'desc',
- ]
- 填充:
- 要?jiǎng)?chuàng)建和填充Elasticsearch索引和映射,請(qǐng)使用search_index命令:
- $python manage.py search_index — rebuild
- 要獲得更多幫助,請(qǐng)使用命令:
- $ python manage.py search_index —help
- 現(xiàn)在,當(dāng)執(zhí)行以下操作時(shí):
- category = Category(
- name="Computer and Accessories",
- desc="abc desc"
- )
- category.save()
- 該對(duì)象也將保存在Elasticsearch中(使用信號(hào)處理程序)。
- 搜索:
- 要獲取elasticsearch-dsl-py搜索實(shí)例,請(qǐng)使用:
- s = CategoryDocument.search().filter("term", name="computer")
- # or
- s = CategoryDocument.search().query("match", description="abc")
- for hit in s:
- print(
- "Category name : {}, description {}".format(hit.name, hit.desc)
- )
- 要將彈性搜索結(jié)果轉(zhuǎn)換為真實(shí)的Django查詢集,請(qǐng)注意,這會(huì)花費(fèi)一個(gè)SQL請(qǐng)求來(lái)檢索具有由Elasticsearch查詢返回的ID的模型實(shí)例。
- s = CategoryDocument.search().filter("term", name="computer")[:30]
- qs = s.to_queryset()
- # qs is just a django queryset and it is called with order_by to keep
- # the same order as the elasticsearch result.
- for cat in qs:
- print(cat.name)
- 完畢,如果有任何疑問(wèn),歡迎留言交流。
【編輯推薦】






