Изменения документа Инициализация процесса

Редактировал(а) Alexandr Fokin 2024/06/12 15:27

<
От версии < 1.12 >
отредактировано Alexandr Fokin
на 2024/01/11 13:13
К версии < 1.45 >
отредактировано Alexandr Fokin
на 2024/01/27 17:44
>
Изменить комментарий: К данной версии нет комментариев

Комментарий

Подробности

Свойства страницы
Родительский документ
... ... @@ -1,1 +1,1 @@
1 лгоритмы.Процессы.WebHome
1 +Архитектура и модели.Модели.Процессы.WebHome
Содержимое
... ... @@ -1,21 +1,77 @@
1 -|(% style="width:15px" %) |(% style="width:1470px" %)(((
2 -|(% style="width:179px" %)Ручной и автоматический запуск процесса|(% style="width:1271px" %)
3 -|(% style="width:179px" %)Валидация перед запуском|(% style="width:1271px" %)(((
4 -|Валидация доменных объектов на возможность запуска экземпляра процесса (с гарантией, что доменной объект не будет изменен до конца транзакции планировщика, иначе мы можем принять некорректное решение о запуске процесса).
5 -В случае использования [[Оптимистичная блокировка>>doc:Архитектура и модели.Блокировки.Оптимистичная блокировка.WebHome]], необходимо также гарантировать инкрементацию ключа доменных сущностей т.к. скорее всего их поля не меняются напрямую.
6 -Как вариант - использование более строго уровня изоляции.
7 -|(((
1 +(% border="1" %)
2 +|(% style="width:157px" %)Триггер инициализации|(% style="width:1328px" %)(((
3 +(% border="1" %)
4 +|(% style="width:118px" %)Событие|(% style="width:1191px" %)(((
5 +* Событие с UI (по вводу пользователя)
6 +* Доменное событие
7 +* Поступление сообщения
8 +* Срабатывание планировщика или периодического таймера (например [[CRON>>doc:Хостинг.Операционные системы.Linux.Механизмы.CRON.WebHome]]).
9 +)))
10 +|(% style="width:118px" %)Тип триггера|(% style="width:1191px" %)(((
11 +* Ручной запуск (Инициирован пользователем)
12 +* По событию (Инициирован событием)
13 +* Автоматический по расписанию (Инициирован планировщиком)
14 +)))
15 +)))
16 +|(% style="width:157px" %)Параметры инициализации|(% style="width:1328px" %)(((
17 +(% border="1" %)
18 +|(% style="width:227px" %)Тип|(% style="width:272px" %)Параметр|(% style="width:1023px" %)
19 +|(% style="width:227px" %)По сущности|(% style="width:272px" %)1 ключ|(% style="width:1023px" %)
20 +|(% style="width:227px" %)По группе сущностей ()|(% style="width:272px" %)Набор ключей сущностей|(% style="width:1023px" %)
21 +|(% style="width:227px" %)На основе данных, по выборке с параметрами|(% style="width:272px" %)dto с параметрами|(% style="width:1023px" %)
22 +)))
23 +|(% style="width:157px" %)Инициализация на основе данных|(% style="width:1328px" %)(((
24 +|(% style="width:142px" %)Тип|(% style="width:1168px" %)
25 +|(% style="width:142px" %)Выборка батчей до исчерпания|(% style="width:1168px" %)(((
26 +Выборка данных до тех пор пока они не исчерпаются.
27 +
28 +Замечания:
29 +
30 +* Плохо подходит для больших объемов данных. Может привести к долгому выполнению выборки.
31 +* Плохо подходит для сложных условий т.к. может привезти к тому, что будет невозможно выразить полный набор условий в виде запроса или запрос получиться сложным и также будет долго выполняться.
32 +* Одна ошибка блокирует всю инициализацию.
33 +Если при обработке ключевого доменного объекта возникнет ошибка, то это окажет влияние на всю операцию инициализации.
34 +Может быть проблематично отбросить данный доменный объект, чтобы он не попал в выборку.
35 +
36 +Пример:
37 +Соединение таблицы доменных сущностей с таблицей процесса и выборка тех сущностей, по которым нет записи в таблице процесса.
38 +)))
39 +|(% style="width:142px" %)Перебор батчей данных|(% style="width:1168px" %)(((
40 +Когда речь заходит о переборе данных, то явно касаемся вопрос пагинации.
41 +
42 +Условия:
43 +
44 +* Фильтрация - возможность перебрать не весь сет данных, а только часть по условию.
45 +* Параллелизм - возможность выполнения операции параллельно (с распределением блоков между обработчиками).
46 +* Модификация данных - гарантия что в процессе, данные могут быть изменены (самой инициализацией или внешним воздействием).
47 +
48 +|(% style="width:125px" %)Тип пагинации|(% style="width:121px" %)Параллелизм|(% style="width:176px" %)Модификация данных|(% style="width:188px" %)Фильтрация|(% style="width:540px" %)Описание
49 +|(% style="width:125px" %)Offset|(% style="width:121px" %)+|(% style="width:176px" %)-|(% style="width:188px" %)+|(% style="width:540px" %)1) Распределить фиксирует общее кол-во страниц.
50 +2) Распределить запускает обработчики на диапазонах страниц данных.
51 +|(% style="width:125px" %)Keyset|(% style="width:121px" %)-|(% style="width:176px" %)+|(% style="width:188px" %)+|(% style="width:540px" %)
52 +)))
53 +)))
54 +|(% style="width:157px" %)Валидация перед запуском|(% style="width:1328px" %)(((
55 +(% border="1" %)
56 +|(% style="width:114px" %)Доменные объекты|(% style="width:1195px" %)(((
57 +* Валидация доменных объектов на возможность запуска экземпляра процесса
58 +(с гарантией, что доменной объект не будет изменен до конца транзакции инициализации, иначе мы можем принять некорректное решение о запуске процесса).
59 +* В случае использования [[Оптимистичная блокировка>>doc:Архитектура и модели.Блокировки.Оптимистичная блокировка.WebHome]], необходимо также гарантировать инкрементацию ключа доменных сущностей т.к. скорее всего их поля не изменятся напрямую.
60 +* Как вариант - использование более строго уровня изоляции.
61 +)))
62 +|(% style="width:114px" %)Процессы|(% style="width:1195px" %)(((
8 8  Если существуют предыдущие экземпляры процесса (__по ключевому набору__), то они также валидируются на возможность запуска нового экземпляра
9 9  
10 -|(% colspan="2" style="width:157px" %)Отношение экземпляров процесса и ключевых доменных сущностей.
11 -|(% style="width:157px" %)Допускается создание только одного экземпляра процесса|(% style="width:1078px" %)Экземпляр ключевой доменной сущности <-(1 к 1)-> Экземпляр процесса.
12 -Для каждого уникального ключа может быть только 0 или 1 экземпляр процесса.
13 -|(% style="width:157px" %)Допускается создание более одного экземпляра|(% style="width:1078px" %)(((
14 -Здесь речь идет не о том, что запуск возможен в один момент времени, а в целом, что допускается ситуация, что в случае если процесс уже выполнялся, мы не меняем его состояние и перезапускаем, а создаем новый экземпляр (при этом гарантируя валидность).
65 +|(% colspan="2" %)Отношение экземпляров процесса и ключевых доменных сущностей.
66 +|(% style="width:199px" %)Допускается создание только одного экземпляра|(% style="width:978px" %)__Ключевые доменные сущности__ <-(1 к 1)-> __Экземпляр процесса__.
67 +Для каждого уникального ключа может быть не более 1 экземпляра процесса.
68 +|(% style="width:199px" %)Допускается создание более одного экземпляра|(% style="width:978px" %)(((
69 +Здесь речь идет не только о том, что несколько экземпляров активны в один и тот-же момент времени, а о том, что допускается ситуация, что в случае если у нас уже есть существующий экземпляр процесса (выполнявшийся ранее), и вместо того, чтобы изменить его состояние и перезапустить, создаем новый экземпляр (при этом гарантируя валидность такого действия).
15 15  \\В таком случае мы можем представить следующую модель данных:
16 -Ключевые доменные сущности <-(1 к 1)-> Ключевой сквозной контекст процесса <-(1 к N)-> экземпляр процесса.
71 +__Ключевые доменные сущности__ <-(1 к 1)-> __Ключевой сквозной контекст процесса__ <-(1 к N)-> __Экземпляр процесса__.
17 17  
18 18  
74 +(% border="1" %)
19 19  |Ключевой сквозной контекст не всегда может быть выражен явно, но фактически он будет существовать.
20 20  |(((
21 21  Пример 1
... ... @@ -31,23 +31,30 @@
31 31  
32 32  Например:
33 33  
34 -* целью является создание некоторого доменного объекта, когда он будет создан, информацию зафиксируется в сквозном контексте.
35 -* Эти данные не позволят запустить новый экземпляр так как цель достигнута - объект создан.
36 -* Если вдруг выясняется, что по какой-то причине созданный доменный объект объявляется недействительным, и не обходимо запустить процесс (по тому же ключу) для создания нового экземпляра доменного объекта, то также необходимо сбросить данные в сквозном контексте.
90 +* Целью является создание некоторого доменного объекта, когда он будет создан, информация зафиксируется в сквозном контексте.
91 +* Эти данные не позволят запустить новый экземпляр процесса так как цель достигнута - объект создан.
92 +* Если вдруг выясняется, что по какой-то причине созданный доменный объект объявляется недействительным, и необходимо запустить новый экземпляр процесса (по тому же ключу) для создания нового экземпляра доменного объекта, то также нужно выполнить сброс данных в сквозном контексте.
37 37  (ручной сброс или подписка на доменной событие, оповещающее о смене статуса созданного объекта (аннулирование, блокировка и др.))
38 38  )))
39 39  )))
40 40  )))
97 +
98 +
41 41  )))
42 -|(% style="width:179px" %) |(% style="width:1271px" %)
100 +|(% style="width:157px" %) |(% style="width:1328px" %)
43 43  
102 +(% border="1" %)
103 +|(% style="width:15px" %) |(% style="width:1470px" %)(((
104 +(% border="1" %)
44 44  |(% style="width:151px" %)На основе события|(% style="width:1188px" %)Событие запуска процесса поступает извне, и обязательства о выборке данных для процесса лежат на внешнем компоненте.
45 45  События могут помещаться в некоторый буфер - хранилище (брокер сообщений, БД) и разбираться обработчиком до исчерпания.
46 46  |(% style="width:151px" %)На основе данных|(% style="width:1188px" %)(((
108 +(% border="1" %)
47 47  |(% colspan="2" %)Замечания
48 48  |Параллелизм|Гарантия, что код планировщика выполняются в эксклюзивном режиме, в случае если он запущен в нескольких экземплярах.
49 49  Предполагается [[Пессимистичная блокировка>>doc:Архитектура и модели.Блокировки.Пессимистичная блокировка.WebHome]] на уровне всех экземпляров.
50 50  
113 +(% border="1" %)
51 51  |(% style="width:177px" %)Тип|(% style="width:993px" %)
52 52  |(% style="width:177px" %)Выборка до исчерпания|(% style="width:993px" %)(((
53 53  Выборка данных до тех пор пока они не исчерпаются.
... ... @@ -54,8 +54,9 @@
54 54  
55 55  Замечания:
56 56  
57 -* Плохо подходит для больших объемов данных. Может привести к тому,
120 +* Плохо подходит для больших объемов данных. Может привести к долгому выполнению выборки.
58 58  * Плохо подходит для сложных условий т.к. может привезти к тому, что будет невозможно выразить полный набор условий в виде запроса или запрос получиться сложным и также будет долго выполняться.
122 +* Если при обработке ключевого доменного объекта возникнет ошибка, то это окажет влияние на всю операцию инициализации. Может быть проблематично отбросить данный доменный объект, чтобы он не попал в выборку.
59 59  
60 60  Пример:
61 61  Соединение таблицы доменных сущностей с таблицей процесса и выборка тех сущностей, по которым нет записи в таблице процесса.
... ... @@ -63,18 +63,24 @@
63 63  |(% style="width:177px" %)Инициализация, привязанная к дате.|(% style="width:993px" %)Обработчик привязан к конкретной дате и рассматривает некоторый ограниченный набор, например одни сутки относительно указанной даты.
64 64  Таким образом мы явно ограничиваем блок данных. Но нужно учесть сценарии с возникновением ошибки, т.к. следующее срабатывание уже будет на основе новой даты.
65 65  |(% style="width:177px" %)Перебор всего сета доменных сущностей.|(% style="width:993px" %)(((
66 -Необходимое условие: Наличие способа перебрать данные батчами, гарантия что данные не удаляются.
130 +| |Пагинация|Параллелизм|Фильтрация сета|
131 +| |Страницы|+|-|
132 +| |Смещение|-|+|
67 67  
68 -Вариант 1:
69 -Если мы уверены, что доменные объекты не удаляются, то мы можем отсортировать их по дате создания и первичному ключу. Таким образом мы получим фиксированные страницы данных, которые можно обрабатывать параллельно. Невозможно выполнить, если допускается удаление объектов.
134 +Необходимое условие: Наличие способа перебрать данные сета данных.
135 +Вариант 1: Если перебираем записи без использования параллелизма, то нам достаточно организовать некоторую пагинацию и последовательно идти, обрабатывая подходящие для запуска процесса строки.
136 +\\Вариант 2:
137 +Если мы уверены, что доменные объекты не удаляются, то мы можем отсортировать их по дате создания и первичному ключу (Если есть уникальный автоинкреметный числовой ключ, то можно использовать его).
138 +Таким образом мы получим детерминированные страницы данных, которые даже можно обрабатывать параллельно.
139 +Невозможно выполнить, если допускается удаление объектов т.к. оно может изменить данные в страницах.
140 +Либо можно прикинуть вариант, когда мы используем блокировку доменных объектов через БД, таким образом в каждом обрабатываем батче (в один момент времени) будет уникальный набор доменных объектов, и если один и тот же объект попадет в разные батчи, то в первом случае он обработается, а во втором он будет отброшен (есть вероятность, что некоторые строки, существовавшие на момент начала операции, не попадут в выборку).
70 70  
71 -Вариант 2:
72 -Если есть уникальный автоинкреметный числовой ключ, то можно использовать его.
73 -
74 -Вариант 3:
142 +Вариант 4:
75 75  Если кол-во записей не очень велико и мы можем без проблем полностью уместить сет всех ключей в оперативной памяти.
76 76  (Не требует гарантии, что сущность нельзя удалить, т,к. в случае обнаружения удаления можно просто пропустить ключ).
77 77  
146 +[[Пагинация | Paging>>doc:Разработка.Базы данных.Сценарии.Пагинация | Paging.WebHome]]
147 +
78 78  Can queries that users ORDER BY using date to sort data be non deterministic?
79 79  [[https:~~/~~/dba.stackexchange.com/questions/241056/can-queries-that-users-order-by-using-date-to-sort-data-be-non-deterministic>>https://dba.stackexchange.com/questions/241056/can-queries-that-users-order-by-using-date-to-sort-data-be-non-deterministic]]
80 80  )))