Изменения документа Инициализация процесса
Редактировал(а) Alexandr Fokin 2024/06/12 15:27
<
>
отредактировано Alexandr Fokin
на 2024/01/27 17:55
на 2024/01/27 17:55
отредактировано Alexandr Fokin
на 2024/01/27 17:44
на 2024/01/27 17:44
Изменить комментарий:
К данной версии нет комментариев
Комментарий
-
Свойства страницы (1 изменено, 0 добавлено, 0 удалено)
Подробности
- Свойства страницы
-
- Содержимое
-
... ... @@ -21,7 +21,6 @@ 21 21 |(% style="width:227px" %)На основе данных, по выборке с параметрами|(% style="width:272px" %)dto с параметрами|(% style="width:1023px" %) 22 22 ))) 23 23 |(% style="width:157px" %)Инициализация на основе данных|(% style="width:1328px" %)((( 24 -(% border="1" %) 25 25 |(% style="width:142px" %)Тип|(% style="width:1168px" %) 26 26 |(% style="width:142px" %)Выборка батчей до исчерпания|(% style="width:1168px" %)((( 27 27 Выборка данных до тех пор пока они не исчерпаются. ... ... @@ -40,13 +40,16 @@ 40 40 |(% style="width:142px" %)Перебор батчей данных|(% style="width:1168px" %)((( 41 41 Когда речь заходит о переборе данных, то явно касаемся вопрос пагинации. 42 42 43 - Стоит учитыватьследующие моменты:42 +Условия: 44 44 45 -* Фильтрация - переб орограниченногоподмножестваот всегонабораданных(условие).44 +* Фильтрация - возможность перебрать не весь сет данных, а только часть по условию. 46 46 * Параллелизм - возможность выполнения операции параллельно (с распределением блоков между обработчиками). 47 47 * Модификация данных - гарантия что в процессе, данные могут быть изменены (самой инициализацией или внешним воздействием). 48 48 49 -Keyset пагинации может быть более эффективной (с точки зрения стоимости запроса). 48 +|(% style="width:125px" %)Тип пагинации|(% style="width:121px" %)Параллелизм|(% style="width:176px" %)Модификация данных|(% style="width:188px" %)Фильтрация|(% style="width:540px" %)Описание 49 +|(% style="width:125px" %)Offset|(% style="width:121px" %)+|(% style="width:176px" %)-|(% style="width:188px" %)+|(% style="width:540px" %)1) Распределить фиксирует общее кол-во страниц. 50 +2) Распределить запускает обработчики на диапазонах страниц данных. 51 +|(% style="width:125px" %)Keyset|(% style="width:121px" %)-|(% style="width:176px" %)+|(% style="width:188px" %)+|(% style="width:540px" %) 50 50 ))) 51 51 ))) 52 52 |(% style="width:157px" %)Валидация перед запуском|(% style="width:1328px" %)((( ... ... @@ -92,5 +92,62 @@ 92 92 ))) 93 93 ))) 94 94 ))) 97 + 98 + 95 95 ))) 96 96 |(% style="width:157px" %) |(% style="width:1328px" %) 101 + 102 +(% border="1" %) 103 +|(% style="width:15px" %) |(% style="width:1470px" %)((( 104 +(% border="1" %) 105 +|(% style="width:151px" %)На основе события|(% style="width:1188px" %)Событие запуска процесса поступает извне, и обязательства о выборке данных для процесса лежат на внешнем компоненте. 106 +События могут помещаться в некоторый буфер - хранилище (брокер сообщений, БД) и разбираться обработчиком до исчерпания. 107 +|(% style="width:151px" %)На основе данных|(% style="width:1188px" %)((( 108 +(% border="1" %) 109 +|(% colspan="2" %)Замечания 110 +|Параллелизм|Гарантия, что код планировщика выполняются в эксклюзивном режиме, в случае если он запущен в нескольких экземплярах. 111 +Предполагается [[Пессимистичная блокировка>>doc:Архитектура и модели.Блокировки.Пессимистичная блокировка.WebHome]] на уровне всех экземпляров. 112 + 113 +(% border="1" %) 114 +|(% style="width:177px" %)Тип|(% style="width:993px" %) 115 +|(% style="width:177px" %)Выборка до исчерпания|(% style="width:993px" %)((( 116 +Выборка данных до тех пор пока они не исчерпаются. 117 + 118 +Замечания: 119 + 120 +* Плохо подходит для больших объемов данных. Может привести к долгому выполнению выборки. 121 +* Плохо подходит для сложных условий т.к. может привезти к тому, что будет невозможно выразить полный набор условий в виде запроса или запрос получиться сложным и также будет долго выполняться. 122 +* Если при обработке ключевого доменного объекта возникнет ошибка, то это окажет влияние на всю операцию инициализации. Может быть проблематично отбросить данный доменный объект, чтобы он не попал в выборку. 123 + 124 +Пример: 125 +Соединение таблицы доменных сущностей с таблицей процесса и выборка тех сущностей, по которым нет записи в таблице процесса. 126 +))) 127 +|(% style="width:177px" %)Инициализация, привязанная к дате.|(% style="width:993px" %)Обработчик привязан к конкретной дате и рассматривает некоторый ограниченный набор, например одни сутки относительно указанной даты. 128 +Таким образом мы явно ограничиваем блок данных. Но нужно учесть сценарии с возникновением ошибки, т.к. следующее срабатывание уже будет на основе новой даты. 129 +|(% style="width:177px" %)Перебор всего сета доменных сущностей.|(% style="width:993px" %)((( 130 +| |Пагинация|Параллелизм|Фильтрация сета| 131 +| |Страницы|+|-| 132 +| |Смещение|-|+| 133 + 134 +Необходимое условие: Наличие способа перебрать данные сета данных. 135 +Вариант 1: Если перебираем записи без использования параллелизма, то нам достаточно организовать некоторую пагинацию и последовательно идти, обрабатывая подходящие для запуска процесса строки. 136 +\\Вариант 2: 137 +Если мы уверены, что доменные объекты не удаляются, то мы можем отсортировать их по дате создания и первичному ключу (Если есть уникальный автоинкреметный числовой ключ, то можно использовать его). 138 +Таким образом мы получим детерминированные страницы данных, которые даже можно обрабатывать параллельно. 139 +Невозможно выполнить, если допускается удаление объектов т.к. оно может изменить данные в страницах. 140 +Либо можно прикинуть вариант, когда мы используем блокировку доменных объектов через БД, таким образом в каждом обрабатываем батче (в один момент времени) будет уникальный набор доменных объектов, и если один и тот же объект попадет в разные батчи, то в первом случае он обработается, а во втором он будет отброшен (есть вероятность, что некоторые строки, существовавшие на момент начала операции, не попадут в выборку). 141 + 142 +Вариант 4: 143 +Если кол-во записей не очень велико и мы можем без проблем полностью уместить сет всех ключей в оперативной памяти. 144 +(Не требует гарантии, что сущность нельзя удалить, т,к. в случае обнаружения удаления можно просто пропустить ключ). 145 + 146 +[[Пагинация | Paging>>doc:Разработка.Базы данных.Сценарии.Пагинация | Paging.WebHome]] 147 + 148 +Can queries that users ORDER BY using date to sort data be non deterministic? 149 +[[https:~~/~~/dba.stackexchange.com/questions/241056/can-queries-that-users-order-by-using-date-to-sort-data-be-non-deterministic>>https://dba.stackexchange.com/questions/241056/can-queries-that-users-order-by-using-date-to-sort-data-be-non-deterministic]] 150 +))) 151 +))) 152 +))) 153 +|(% style="width:15px" %) |(% style="width:1470px" %) 154 + 155 +