Исходный код вики ElasticSearch
Версия 5.10 от Alexandr Fokin на 2022/08/14 14:51
Скрыть последних авторов
author | version | line-number | content |
---|---|---|---|
![]() |
4.9 | 1 | ==== ElasticSearch ==== |
![]() |
2.1 | 2 | |
![]() |
4.9 | 3 | NoSql база данных для хранения документов. Одно из основных функций - возможность выполнения полнотекстового поиска по документа. |
4 | В качестве интерфейса взаимодействия выступает HTTP Api. | ||
![]() |
5.6 | 5 | Написан на [[Java>>Разработка.JVM.Java.WebHome]], механизм поискового движка основан на библиотеки [[Apache Lucene>>Разработка.JVM.Java.Библиотеки.Apache Lucene.WebHome]], для логирования используется [[Apache Log4j>>doc:Разработка.JVM.Java.Библиотеки.Apache Log4j.WebHome]]. |
![]() |
4.8 | 6 | |
![]() |
4.5 | 7 | ---- |
![]() |
2.1 | 8 | |
![]() |
4.10 | 9 | ==== Структурные элементы ==== |
![]() |
2.1 | 10 | |
![]() |
4.9 | 11 | |(% style="width:364px" %) |(% style="width:1158px" %) |
12 | |(% style="width:364px" %)Индекс ~| Index|(% style="width:1158px" %)Содержит группу Типов. | ||
13 | Упрощенно аналог БД. | ||
![]() |
4.13 | 14 | |(% style="width:364px" %)Тип ~| Type|(% style="width:1158px" %)((( |
15 | Содержит группу Документов и метаданные Маппинг. | ||
![]() |
4.9 | 16 | Упрощенно - аналог таблицы. |
![]() |
4.13 | 17 | |
18 | Предполагает группировку документов с единой структурой. | ||
19 | ))) | ||
20 | |(% style="width:364px" %)Маппинг ~| Mapping|(% style="width:1158px" %)((( | ||
21 | Содержащий информацию о структуре всех документов внутри Типа. | ||
![]() |
4.15 | 22 | Для каждого поля в документах типа определяется его тип данных, которые влияет на то, как поле будет использоваться с точки зрения поиска. При этом пытаясь автоматически определить тип данных. |
![]() |
4.13 | 23 | |
24 | В случае добавления нового документа с полем, сведений о котором нет в маппинге, метаданные о поле автоматически заносяться в маппинг. | ||
![]() |
4.18 | 25 | Добавление документа, содержащего поле с типом данных, отличным от метаданных в маппинге, приведет к ошибке. |
![]() |
5.9 | 26 | |
27 | Не рекомендуется иметь несколько Типов в едином Индексе, у которых в Маппинге имеются поля с одинаковыми названиями, но разными типами данных. | ||
![]() |
4.13 | 28 | ))) |
![]() |
4.11 | 29 | |(% style="width:364px" %)Документ|(% style="width:1158px" %)((( |
30 | Принадлежит 1 группе. | ||
![]() |
4.12 | 31 | Уникально определяется совокупностью идентификаторов <IndexName>.<TypeName>.<DocumentId>. |
![]() |
4.30 | 32 | Имеет номер версии, которая автоматически инкрементируется при обновлении документа. |
33 | DocumentId может генерироваться как клиентом, так и сервером. | ||
![]() |
5.7 | 34 | |
35 | Опциональны поля: | ||
36 | _timestamp - ... | ||
37 | _ttl - временная задержка, после которой документ будет автоматически удален | ||
![]() |
4.11 | 38 | ))) |
39 | |(% style="width:364px" %) |(% style="width:1158px" %) | ||
![]() |
5.4 | 40 | |(% style="width:364px" %)Операция добавления (индексирования) документа.|(% style="width:1158px" %)((( |
![]() |
5.8 | 41 | При добавлении для документа определяется шард для размещения. Сначала документ отправляется на Master экземпляр шарда, а от него также распространяется на Slave реплики шарда. |
![]() |
5.4 | 42 | |
43 | После завершения запроса на добавления документа, его содержимое может быть не доступно для поиска т.к. индексация новых документов выполняется сервером ElasticSearch периодически, через заданный промежуток времени (частота задается через параметр Индекса). | ||
44 | ))) | ||
![]() |
5.10 | 45 | |(% style="width:364px" %)Операция обновления документа.|(% style="width:1158px" %)((( |
46 | | | ||
47 | |Обновление существующего документа с использованием констант. | ||
48 | |Upset обновить или создать, если не существует. | ||
49 | |Обновление существующего документа с использованием данных из текущего и скриптов на [[Apache Groovy>>Разработка.JVM.Apache Groovy.WebHome]]. | ||
50 | |||
51 | Для concurrency может использоваться механизм оптимистичной блокировки на основе версии документа. | ||
52 | ))) | ||
![]() |
4.26 | 53 | |(% style="width:364px" %)Операция поиска.|(% style="width:1158px" %)Может осуществляться как в рамках одного конкретного Типа, так и на уровне Типов, расположенных в различных Индексах. |
![]() |
5.5 | 54 | |(% style="width:364px" %)Операция получения документа по DocumentId.|(% style="width:1158px" %)В отличии от операции поиска, в которой документ может быть не доступен сразу же, запрашивать документ по DocumentId можно сразу после добавления. |
55 | Является дешевой операций т.к. не требует выполнения поиска. | ||
![]() |
4.26 | 56 | |(% style="width:364px" %) |(% style="width:1158px" %) |
![]() |
4.20 | 57 | |(% style="width:364px" %)Механизм масштабирования и отказоустойчивости.|(% style="width:1158px" %)((( |
![]() |
4.28 | 58 | Несколько узлов объединяются в кластер. Клиентские приложения могут взаимодействовать с любой из нод кластера. |
![]() |
4.20 | 59 | Поддерживается шардинг - разбиение данных на блоки и распределение их по узлам кластера. |
60 | Для каждого шарда можно назначать кол-во реплик, копий. При этом среди репликаций один шард будем master, а остальные slave. | ||
![]() |
4.21 | 61 | |
![]() |
4.22 | 62 | Рекомендуется наличие быстрого и надежного сетевого соединения между узлами кластера. (split brain дописать позже). |
![]() |
4.23 | 63 | |
![]() |
4.27 | 64 | Параметры кол-ва шардов и реплик определяются на уровне Индекса. Кол-во реплик можно менять в рантайм, а кол-во шардов нельзя. |
![]() |
4.24 | 65 | 1 экземпляр шарда ElasticSearch соответствует 1 экземпляру индекса Apache Lucene. |
![]() |
4.20 | 66 | ))) |
![]() |
4.25 | 67 | |(% style="width:364px" %)Индекса Apache Lucene|(% style="width:1158px" %)Содержит оригинальные документы и (Term dictionary maps). |
68 | Term dictionary maps - содержит информацию о всех уникальных словах-терминах, номерах документов, в которых они расположены, а также кол-во повторений для каждого документа. | ||
![]() |
4.9 | 69 | |
70 | ---- | ||
71 | |||
72 | ==== Ссылки: ==== | ||
73 | |||
![]() |
2.1 | 74 | The heart of the free and open Elastic Stack |
75 | https://www.elastic.co/elasticsearch/ | ||
76 | |||
77 | Elasticsearch для .NET - разработчиков | ||
78 | https://www.youtube.com/watch?v=iQ-Cmn6hgJg | ||
79 | |||
![]() |
3.1 | 80 | |
81 | Основы Elasticsearch | ||
82 | https://habr.com/ru/post/280488/ | ||
![]() |
4.7 | 83 | |
84 | |||
85 | miollek/Free-Elasticsearch-Books | ||
86 | https://github.com/miollek/Free-Elasticsearch-Books | ||
87 |