Изменения документа Инициализация процесса

Редактировал(а) Alexandr Fokin 2024/06/12 15:27

<
От версии < 1.38 >
отредактировано Alexandr Fokin
на 2024/01/22 11:05
К версии < 1.55 >
отредактировано Alexandr Fokin
на 2024/06/12 15:26
>
Изменить комментарий: Updated parent field.

Комментарий

Подробности

Свойства страницы
Родительский документ
... ... @@ -1,1 +1,1 @@
1 -Архитектура и модели.Модели.Процессы.WebHome
1 +xwiki:Архитектура и модели.Модели.Процес.WebHome
Содержимое
... ... @@ -1,31 +1,73 @@
1 1  (% border="1" %)
2 -|(% style="width:15px" %) |(% style="width:1470px" %)(((
2 +|(% style="width:157px" %)Триггер инициализации|(% style="width:1328px" %)(((
3 3  (% border="1" %)
4 -|(% style="width:179px" %)Ручной и автоматический запуск процесса|(% style="width:1271px" %)(((
5 -|Автоматический запуск (по таймеру)|
6 -|Ручной запуск (одиночный, групповой, групповой с параметрами выборки).|
7 -|Запуск по событию|
4 +|(% style="width:118px" %)Событие|(% style="width:1191px" %)(((
5 +* Событие с UI (по вводу пользователя)
6 +* Доменное событие
7 +* Поступление сообщения
8 +* Срабатывание планировщика или периодического таймера (например [[CRON>>doc:Хостинг.Операционные системы.Linux.Механизмы.CRON.WebHome]]).
9 +)))
10 +|(% style="width:118px" %)Тип триггера|(% style="width:1191px" %)(((
11 +* Ручной запуск (Инициирован пользователем)
12 +* По событию (Инициирован событием)
13 +* Автоматический по расписанию (Инициирован планировщиком)
14 +)))
15 +)))
16 +|(% style="width:157px" %)Параметры инициализации|(% style="width:1328px" %)(((
17 +(% border="1" %)
18 +|(% style="width:227px" %)Тип|(% style="width:272px" %)Параметр|(% style="width:1023px" %)
19 +|(% style="width:227px" %)По сущности|(% style="width:272px" %)1 ключ|(% style="width:1023px" %)
20 +|(% style="width:227px" %)По группе сущностей ()|(% style="width:272px" %)Набор ключей сущностей|(% style="width:1023px" %)
21 +|(% style="width:227px" %)На основе данных, по выборке с параметрами|(% style="width:272px" %)dto с параметрами|(% style="width:1023px" %)
22 +)))
23 +|(% style="width:157px" %)Инициализация на основе данных|(% style="width:1328px" %)(((
24 +(% border="1" %)
25 +|(% style="width:142px" %)Тип|(% style="width:1168px" %)
26 +|(% style="width:142px" %)Выборка батчей до исчерпания|(% style="width:1168px" %)(((
27 +Выборка данных до тех пор пока они не исчерпаются.
8 8  
9 -
29 +Замечания:
30 +
31 +* Плохо подходит для больших объемов данных. Может привести к долгому выполнению выборки.
32 +* Плохо подходит для сложных условий т.к. может привезти к тому, что будет невозможно выразить полный набор условий в виде запроса или запрос получиться сложным и также будет долго выполняться.
33 +* Одна ошибка блокирует всю инициализацию.
34 +Если при обработке ключевого доменного объекта возникнет ошибка, то это окажет влияние на всю операцию инициализации.
35 +Может быть проблематично отбросить данный доменный объект, чтобы он не попал в выборку.
36 +
37 +Пример:
38 +Соединение таблицы доменных сущностей с таблицей процесса и выборка тех сущностей, по которым нет записи в таблице процесса.
10 10  )))
11 -|(% style="width:179px" %)Валидация перед запуском|(% style="width:1271px" %)(((
40 +|(% style="width:142px" %)Перебор батчей данных|(% style="width:1168px" %)(((
41 +Когда речь заходит о переборе данных, то явно касаемся вопрос [[Пагинация | Paging>>doc:Разработка.Базы данных.Сценарии.Пагинация | Paging.WebHome]].
42 +
43 +Стоит учитывать следующие моменты:
44 +
45 +* Фильтрация - перебор ограниченного подмножества от всего набора данных (условие).
46 +* Параллелизм - возможность выполнения операции параллельно (с распределением блоков между обработчиками).
47 +* Модификация данных - гарантия что в процессе, данные могут быть изменены (сама инициализация, запуск воркера испонителя процесса, или внешним воздействием).
48 +
49 +Keyset пагинации может быть более эффективной (с точки зрения стоимости запроса) и может избежать части ситуаций пропуска данных (при пагинации на основе страниц).
50 +)))
51 +)))
52 +|(% style="width:157px" %)Валидация перед запуском|(% style="width:1328px" %)(((
12 12  (% border="1" %)
13 -|(((
14 -* Валидация доменных объектов на возможность запуска экземпляра процесса (с гарантией, что доменной объект не будет изменен до конца транзакции планировщика, иначе мы можем принять некорректное решение о запуске процесса).
54 +|(% style="width:114px" %)Доменные объекты|(% style="width:1195px" %)(((
55 +* Валидация доменных объектов на возможность запуска экземпляра процесса
56 +(с гарантией, что доменной объект не будет изменен до конца транзакции инициализации, иначе мы можем принять некорректное решение о запуске процесса).
15 15  * В случае использования [[Оптимистичная блокировка>>doc:Архитектура и модели.Блокировки.Оптимистичная блокировка.WebHome]], необходимо также гарантировать инкрементацию ключа доменных сущностей т.к. скорее всего их поля не изменятся напрямую.
16 16  * Как вариант - использование более строго уровня изоляции.
17 17  )))
18 -|(((
60 +|(% style="width:114px" %)Процессы|(% style="width:1195px" %)(((
19 19  Если существуют предыдущие экземпляры процесса (__по ключевому набору__), то они также валидируются на возможность запуска нового экземпляра
20 20  
21 21  (% border="1" %)
22 -|(% colspan="2" style="width:157px" %)Отношение экземпляров процесса и ключевых доменных сущностей.
23 -|(% style="width:172px" %)Допускается создание только одного экземпляра процесса|(% style="width:1063px" %)Экземпляр ключевой доменной сущности <-(1 к 1)-> Экземпляр процесса.
64 +|(% colspan="2" %)Отношение экземпляров процесса и ключевых доменных сущностей.
65 +|(% style="width:199px" %)Допускается создание только одного экземпляра|(% style="width:978px" %)__Ключевые доменные сущности__ <-(1 к 1)-> __Экземпляр процесса__.
24 24  Для каждого уникального ключа может быть не более 1 экземпляра процесса.
25 -|(% style="width:172px" %)Допускается создание более одного экземпляра|(% style="width:1063px" %)(((
26 -Здесь речь идет не о том, что несколько экземпляров активны в один и тот-же момент времени, а о том, что допускается ситуация, что в случае если у нас уже есть существующий экземпляр процесса (выполнявшийся ранее), мы не меняем его состояние и перезапускаем, а создаем новый экземпляр (при этом гарантируя валидность такого действия).
67 +|(% style="width:199px" %)Допускается создание более одного экземпляра|(% style="width:978px" %)(((
68 +Здесь речь идет не только о том, что несколько экземпляров активны в один и тот-же момент времени, а о том, что допускается ситуация, что в случае если у нас уже есть существующий экземпляр процесса (выполнявшийся ранее), и вместо того, чтобы изменить его состояние и перезапустить, создаем новый экземпляр (при этом гарантируя валидность такого действия).
27 27  \\В таком случае мы можем представить следующую модель данных:
28 -Ключевые доменные сущности <-(1 к 1)-> Ключевой сквозной контекст процесса <-(1 к N)-> Экземпляр процесса.
70 +__Ключевые доменные сущности__ <-(1 к 1)-> __Ключевой сквозной контекст процесса__ <-(1 к N)-> __Экземпляр процесса__.
29 29  
30 30  
31 31  (% border="1" %)
... ... @@ -52,58 +52,3 @@
52 52  )))
53 53  )))
54 54  )))
55 -|(% style="width:179px" %) |(% style="width:1271px" %)
56 -
57 -(% border="1" %)
58 -|(% style="width:151px" %)На основе события|(% style="width:1188px" %)Событие запуска процесса поступает извне, и обязательства о выборке данных для процесса лежат на внешнем компоненте.
59 -События могут помещаться в некоторый буфер - хранилище (брокер сообщений, БД) и разбираться обработчиком до исчерпания.
60 -|(% style="width:151px" %)На основе данных|(% style="width:1188px" %)(((
61 -(% border="1" %)
62 -|(% colspan="2" %)Замечания
63 -|Параллелизм|Гарантия, что код планировщика выполняются в эксклюзивном режиме, в случае если он запущен в нескольких экземплярах.
64 -Предполагается [[Пессимистичная блокировка>>doc:Архитектура и модели.Блокировки.Пессимистичная блокировка.WebHome]] на уровне всех экземпляров.
65 -
66 -(% border="1" %)
67 -|(% style="width:177px" %)Тип|(% style="width:993px" %)
68 -|(% style="width:177px" %)Выборка до исчерпания|(% style="width:993px" %)(((
69 -Выборка данных до тех пор пока они не исчерпаются.
70 -
71 -Замечания:
72 -
73 -* Плохо подходит для больших объемов данных. Может привести к долгому выполнению выборки.
74 -* Плохо подходит для сложных условий т.к. может привезти к тому, что будет невозможно выразить полный набор условий в виде запроса или запрос получиться сложным и также будет долго выполняться.
75 -* Если при обработке ключевого доменного объекта возникнет ошибка, то это окажет влияние на всю операцию инициализации. Может быть проблематично отбросить данный доменный объект, чтобы он не попал в выборку.
76 -
77 -Пример:
78 -Соединение таблицы доменных сущностей с таблицей процесса и выборка тех сущностей, по которым нет записи в таблице процесса.
79 -)))
80 -|(% style="width:177px" %)Инициализация, привязанная к дате.|(% style="width:993px" %)Обработчик привязан к конкретной дате и рассматривает некоторый ограниченный набор, например одни сутки относительно указанной даты.
81 -Таким образом мы явно ограничиваем блок данных. Но нужно учесть сценарии с возникновением ошибки, т.к. следующее срабатывание уже будет на основе новой даты.
82 -|(% style="width:177px" %)Перебор всего сета доменных сущностей.|(% style="width:993px" %)(((
83 -| |Пагинация|Параллелизм|Фильтрация сета|
84 -| |Страницы|+|-|
85 -| |Смещение|-|+|
86 -
87 -
88 -Необходимое условие: Наличие способа перебрать данные сета данных.
89 -Вариант 1: Если перебираем записи без использования параллелизма, то нам достаточно организовать некоторую пагинацию и последовательно идти, обрабатывая подходящие для запуска процесса строки.
90 -\\Вариант 2:
91 -Если мы уверены, что доменные объекты не удаляются, то мы можем отсортировать их по дате создания и первичному ключу (Если есть уникальный автоинкреметный числовой ключ, то можно использовать его).
92 -Таким образом мы получим детерминированные страницы данных, которые даже можно обрабатывать параллельно.
93 -Невозможно выполнить, если допускается удаление объектов т.к. оно может изменить данные в страницах.
94 -Либо можно прикинуть вариант, когда мы используем блокировку доменных объектов через БД, таким образом в каждом обрабатываем батче (в один момент времени) будет уникальный набор доменных объектов, и если один и тот же объект попадет в разные батчи, то в первом случае он обработается, а во втором он будет отброшен (есть вероятность, что некоторые строки, существовавшие на момент начала операции, не попадут в выборку).
95 -
96 -Вариант 4:
97 -Если кол-во записей не очень велико и мы можем без проблем полностью уместить сет всех ключей в оперативной памяти.
98 -(Не требует гарантии, что сущность нельзя удалить, т,к. в случае обнаружения удаления можно просто пропустить ключ).
99 -
100 -[[Пагинация | Paging>>doc:Разработка.Базы данных.Сценарии.Пагинация | Paging.WebHome]]
101 -
102 -Can queries that users ORDER BY using date to sort data be non deterministic?
103 -[[https:~~/~~/dba.stackexchange.com/questions/241056/can-queries-that-users-order-by-using-date-to-sort-data-be-non-deterministic>>https://dba.stackexchange.com/questions/241056/can-queries-that-users-order-by-using-date-to-sort-data-be-non-deterministic]]
104 -)))
105 -)))
106 -)))
107 -|(% style="width:15px" %) |(% style="width:1470px" %)
108 -
109 -
XWiki.XWikiComments[0]
Автор
... ... @@ -1,0 +1,1 @@
1 +XWiki.cccc1808
Комментарий
... ... @@ -1,0 +1,11 @@
1 +Замечание 1.
2 +
3 +При использовании Keyset пагинации строка может быть пропущена только в одном случае. Если процесс перебора записей уже был запущен, и в какой-то момент времени запись была изменена таким образом, что она переместилась назад, текущий указатель.
4 +\\Пример:
5 +Запись1: (Status: 10, Id:1);
6 +Указатель: (Status: 1, Id:1);
7 +Указатель: (Status: 2, Id:N);
8 +Запись1: (Status: 1, Id:1);
9 +...
10 +Указатель: (Status: 10: Id:N);
11 +\\В этом случае строка с Id 1 перепрыгнула назад и не попала в обход. Хотя она на протяжении всего времени удовлетворяла условиям перебора (в том числе на начальный момент времени).
Дата
... ... @@ -1,0 +1,1 @@
1 +2024-01-31 17:08:44.248