Изменения документа Elastic Search

Редактировал(а) Alexandr Fokin 2024/01/08 19:48

<
От версии < 5.33 >
отредактировано Alexandr Fokin
на 2022/08/14 16:32
К версии < 5.36 >
отредактировано Alexandr Fokin
на 2022/11/11 21:25
>
Изменить комментарий: К данной версии нет комментариев

Комментарий

Подробности

Свойства страницы
Содержимое
... ... @@ -1,96 +1,13 @@
1 1  ==== ElasticSearch ====
2 2  
3 3  NoSql база данных для хранения документов. Одно из основных функций - возможность выполнения полнотекстового поиска по документа.
4 -В качестве интерфейса взаимодействия выступает HTTP Api.
5 -Написан на [[Java>>Разработка.JVM.Java.WebHome]], механизм поискового движка основан на библиотеки [[Apache Lucene>>Разработка.JVM.Java.Библиотеки.Apache Lucene.WebHome]], для логирования используется [[Apache Log4j>>doc:Разработка.JVM.Java.Библиотеки.Apache Log4j.WebHome]].
4 +В качестве интерфейса взаимодействия выступает [[HTTP 1.1>>Сети.Протоколы.HTTP 1\.1.WebHome]] Api.
5 +Написан на [[Java>>Разработка.JVM.Java.WebHome]], механизм поискового движка основан на библиотеки [[Apache Lucene>>Разработка.JVM.Java.Библиотеки.Apache Lucene.WebHome]], для логирования используется [[Apache Log4j>>doc:Разработка.JVM.Java.Библиотеки.Apache Log4j.WebHome]].
6 6  
7 7  ----
8 8  
9 -==== Структурные элементы ====
9 +{{children/}}
10 10  
11 -|(% style="width:364px" %) |(% style="width:1158px" %)
12 -|(% style="width:364px" %)Индекс ~| Index|(% style="width:1158px" %)Содержит группу Типов.
13 -Упрощенно аналог БД.
14 -|(% style="width:364px" %)Тип ~| Type|(% style="width:1158px" %)(((
15 -Содержит группу Документов и метаданные Маппинг.
16 -Упрощенно - аналог таблицы.
17 -
18 -Предполагает группировку документов с единой структурой.
19 -)))
20 -|(% style="width:364px" %)Маппинг ~| Mapping|(% style="width:1158px" %)(((
21 -Содержащий информацию о структуре всех документов внутри Типа.
22 -Для каждого поля в документах типа определяется его тип данных, которые влияет на то, как поле будет использоваться с точки зрения поиска. При этом пытаясь автоматически определить тип данных на основе содержимого.
23 -
24 -В случае добавления нового документа с полем, сведений о котором нет в маппинге, метаданные о поле автоматически заносяться в маппинг.
25 -Добавление документа, содержащего поле с типом данных, отличным от метаданных в маппинге, приведет к ошибке.
26 -
27 -Если Маппинг дополняется, то это не затрагивает уже проиндексированные документы, а касается, только тех, которые будут добавлены после.
28 -
29 -Не рекомендуется иметь несколько Типов в едином Индексе, у которых в Маппинге имеются поля с одинаковыми названиями, но разными типами данных.
30 -)))
31 -|(% style="width:364px" %)Документ|(% style="width:1158px" %)(((
32 -Принадлежит 1 группе.
33 -Уникально определяется совокупностью идентификаторов <IndexName>.<TypeName>.<DocumentId>.
34 -
35 -Поля:
36 -
37 -(% style="width:829px" %)
38 -|(% style="width:97px" %) |(% style="width:729px" %)
39 -|(% style="width:97px" %)Id|(% style="width:729px" %)DocumentId может генерироваться как клиентом, так и сервером.
40 -|(% style="width:97px" %)_source|(% style="width:729px" %)Оригинальный загруженный документ
41 -|(% style="width:97px" %)_all|(% style="width:729px" %)Конкатенация всех свойств документа (используется, если при поиске не указаны конкретные поля)
42 -(через Маппинг можно явно исключить определенные поля документа)
43 -|(% style="width:97px" %)_timestamp|(% style="width:729px" %)Временная отметка
44 -|(% style="width:97px" %)_ttl|(% style="width:729px" %)Временная задержка, после которой документ будет автоматически удален
45 -|(% style="width:97px" %)_version|(% style="width:729px" %)Версия документа для механизма оптимистичных блокировок.
46 -|(% style="width:97px" %) |(% style="width:729px" %)
47 -)))
48 -|(% style="width:364px" %) |(% style="width:1158px" %)
49 -|(% style="width:364px" %)Операция добавления (индексирования) документа.|(% style="width:1158px" %)(((
50 -При добавлении для документа определяется шард для размещения. Сначала документ отправляется на Master экземпляр шарда, а от него также распространяется на Slave реплики шарда.
51 -
52 -После завершения запроса на добавления документа, его содержимое может быть не доступно для поиска т.к. индексация новых документов выполняется сервером ElasticSearch периодически, через заданный промежуток времени (частота задается через параметр Индекса).
53 -)))
54 -|(% style="width:364px" %)Операция обновления документа.|(% style="width:1158px" %)(((
55 -(% style="width:836px" %)
56 -|(% style="width:833px" %)Загрузка новой версии документа, полностью затирая предыдущий.
57 -|(% style="width:833px" %)Upsert обновить или создать, если не существует.
58 -|(% style="width:833px" %)Обновление существующего документа с использованием констант.
59 -|(% style="width:833px" %)Обновление существующего документа с использованием данных из текущего документа и скриптов на [[Apache Groovy>>Разработка.JVM.Apache Groovy.WebHome]].
60 -
61 -Можно использовать поле _version для обработки параллелизма.
62 -)))
63 -|(% style="width:364px" %)Операция поиска.|(% style="width:1158px" %)Может осуществляться как в рамках одного конкретного Типа, так и на уровне Типов, расположенных в различных Индексах.
64 -|(% style="width:364px" %)Операция получения документа по DocumentId.|(% style="width:1158px" %)В отличии от операции поиска, в которой документ может быть не доступен сразу же, запрашивать документ по DocumentId можно сразу после добавления.
65 -Является дешевой операций т.к. не требует выполнения поиска.
66 -|(% style="width:364px" %)Операция удаления.|(% style="width:1158px" %)(((
67 -(% style="width:1117px" %)
68 -|(% style="width:197px" %)Удаление Индекса|(% style="width:919px" %)Быстрая операция, реализуется физическим удалением файлов. Можно указать несколько в одном запросе.
69 -|(% style="width:197px" %)Закрытие Индекса|(% style="width:919px" %)Позволяет выгрузить и не использовать индекс, без физического удаления. Позже он может быть загружен.
70 -|(% style="width:197px" %)Удаление Типа|(% style="width:919px" %)Удаление Типа, его маппинг, всех вложенные документы.
71 -|(% style="width:197px" %)Удаление одного/группы документов|(% style="width:919px" %)(((
72 -Документы не удаляются сразу, а помечаются на удаление (само удаление будет выполнено в фоне), перестают выдаваться в поисковой выдаче.
73 -Можно выполнить удаление на основе списка DocumentId или на основе поискового запроса, который отберет документы для удаления.
74 -Также, как и поисковый запрос, может затрагивать документы из нескольких Типов и даже нескольких Индексов.
75 -
76 -Можно использовать поле _version для обработки параллелизма.
77 -База еще некоторое время удерживает сочетание DocumentId + version, и не позволит обратиться к меньшей версии.
78 -)))
79 -)))
80 -|(% style="width:364px" %) |(% style="width:1158px" %)
81 -|(% style="width:364px" %)Механизм масштабирования и отказоустойчивости.|(% style="width:1158px" %)(((
82 -Несколько узлов объединяются в кластер. Клиентские приложения могут взаимодействовать с любой из нод кластера.
83 -Поддерживается шардинг - разбиение данных на блоки и распределение их по узлам кластера.
84 -Для каждого шарда можно назначать кол-во реплик, копий. При этом среди репликаций один шард будем master, а остальные slave.
85 -
86 -Рекомендуется наличие быстрого и надежного сетевого соединения между узлами кластера. (split brain дописать позже).
87 -
88 -Параметры кол-ва шардов и реплик определяются на уровне Индекса. Кол-во реплик можно менять в рантайм, а кол-во шардов нельзя.
89 -1 экземпляр шарда ElasticSearch соответствует 1 экземпляру индекса Apache Lucene.
90 -)))
91 -|(% style="width:364px" %)Индекса Apache Lucene|(% style="width:1158px" %)Содержит оригинальные документы и (Term dictionary maps).
92 -Term dictionary maps - содержит информацию о всех уникальных словах-терминах, номерах документов, в которых они расположены, а также кол-во повторений для каждого документа.
93 -
94 94  ----
95 95  
96 96  ==== Ссылки: ====
XWiki.XWikiComments[2]
Комментарий
... ... @@ -1,5 +1,5 @@
1 1  Сценарий использования:
2 2  
3 -Создание индексов на определенный промежуток времени.
3 +Создание Индексов отвечающих за определенный промежуток времени.
4 4  Через время N1 индексы выгружаются и хранятся по необходимости.
5 5  Через время N2 индексы удаляются.