Исходный код вики Движок cccc1808. ProcessEngine
Версия 27.6 от Alexandr Fokin на 2026/04/11 00:19
Скрыть последних авторов
| author | version | line-number | content |
|---|---|---|---|
| |
1.2 | 1 | |(% style="width:132px" %)Теги поиска|(% style="width:1301px" %)((( |
| 2 | cccc1808. ProcessEngine, cccc1808.ProcessEngine | ||
| |
1.1 | 3 | Очередь задач, Система обработки процессов, Движок обработки процессов. |
| |
1.2 | 4 | [[Процесс>>doc:Архитектура и модели.Модели.Процесс.WebHome]] |
| 5 | ))) | ||
| |
1.10 | 6 | |(% style="width:132px" %) |(% style="width:1301px" %)Универсальный движок для выполнения процессов и очередей задач, позволяющий комбинировать несколько подходов к обработке (см особенности). |
| |
1.30 | 7 | |(% style="width:132px" %) |(% style="width:1301px" %)Процесс является единицей исполнения. В реализации может содержать машину состояний. |
| |
1.10 | 8 | Система триггеров используется для таймеров и передачи сигналов для процессов (с оптимизацией нагрузки). |
| |
1.18 | 9 | |(% style="width:132px" %)Разветывание|(% style="width:1301px" %)((( |
| 10 | |(% style="width:150px" %)База данных|(% style="width:1177px" %)((( | ||
| 11 | Для надежного хранения данных процессов и триггеров. | ||
| 12 | |||
| 13 | * Сейчас есть реализация под EntityFramework. | ||
| |
1.34 | 14 | * Но модель позволяет сделать реализацию под другие решения ([[linq2db>>doc:Разработка.NET.Работа с БД.linq2db.WebHome]] или чистый Ado.Net) (за счет наличия IProcessContainer и методов Update). |
| |
1.18 | 15 | |
| 16 | Для текущей реализации в качестве хранилище может выступать БД, поддерживающая: | ||
| 17 | |||
| |
1.41 | 18 | * Транзакции: транзакции. |
| 19 | * Транзакции: savepoint. | ||
| 20 | (если используются, можно обрабатывать каждый шаг отдельной транзакцией или весь процесс без savepoint изоляции ошибок между шагами). | ||
| 21 | * Блокировка: updatelock. | ||
| 22 | * Блокировка: updatelock skip locked. | ||
| 23 | (частично можно обойтись без него). | ||
| 24 | * Блокировка: sharelock | ||
| |
1.33 | 25 | (можно обойтись без него без сильного влияния) |
| |
1.41 | 26 | * Уровень изоляции: работает на read committed, то что нужно блокируется руками. |
| |
1.46 | 27 | * Для некоторых кейсов желательно возможность выполнить upsert (insert on conflict). |
| |
1.18 | 28 | ))) |
| 29 | |(% style="width:150px" %)Брокер сообщений|(% style="width:1177px" %)((( | ||
| 30 | Используется для накопления и доставки TriggerEvent. | ||
| 31 | |||
| 32 | * Сейчас есть реализация под [[Apache Kafka>>doc:Разработка.Брокеры сообщений.Apache Kafka.WebHome]] | ||
| |
1.44 | 33 | * Скорее всего можно сделать под RabbitMq. |
| |
1.19 | 34 | * Если запускать в одном экземпляре, то можно обойтись inmemory реализаций. |
| |
1.18 | 35 | ))) |
| 36 | ))) | ||
| |
1.1 | 37 | |(% style="width:132px" %)Особенности|(% style="width:1301px" %)((( |
| |
1.25 | 38 | |(% style="width:159px" %)Батчинг при выполнении.|(% style="width:1168px" %)((( |
| |
1.1 | 39 | Возможность использовать и комбинировать разные типы выполнения как |
| 40 | |||
| 41 | * (1 транзакция - 1 процесс), | ||
| 42 | * (1 транзакция - N процессов). | ||
| 43 | ))) | ||
| |
1.6 | 44 | |(% style="width:159px" %)Изоляция шагов и процессов (внутри оной транзакции)|(% style="width:1168px" %)((( |
| |
1.1 | 45 | * Изоляция через db savepoint. |
| 46 | * Для [[EntityFramework ~| EntityFrameworkCore>>doc:Разработка.NET.Работа с БД.EntityFramework | EntityFrameworkCore.WebHome]] возможность делать InMemory снимок [[Создание снимка ChangeTracker>>doc:Разработка.NET.Работа с БД.EntityFramework | EntityFrameworkCore.Сценарии и проблемы.Создание снимка ChangeTracker.WebHome]]. | ||
| |
1.38 | 47 | * Допустима реализация на основе того, что InMemory состояние процесса (и задействованных бизнес сущностей) реализовано в виде Immutable компонентов. В этом случае достаточно просто сохранять и восстанавливать ссылку. |
| |
1.39 | 48 | Но предполагаю, что в большинстве бизнес моделей не так и это не не будет востребованным. |
| |
1.1 | 49 | ))) |
| |
1.6 | 50 | |(% style="width:159px" %)Передача сигналов для процессов через систему триггеров.|(% style="width:1168px" %)((( |
| |
1.1 | 51 | В том числе для передачи сигналов реализована система триггеров. |
| |
1.14 | 52 | Она позволяет оптимизировать операции с БД и уменьшить конкуренцию между процессами за общее состояние (родительский процесс). |
| |
1.1 | 53 | |
| |
6.2 | 54 | См. пример 1. |
| |
1.1 | 55 | ))) |
| |
6.2 | 56 | |(% style="width:159px" %)Stream process|(% style="width:1168px" %)((( |
| 57 | Возможность реализации stream процессов. Которые обрабатываются некоторый поток сообщений. | ||
| 58 | Через использование триггеров (при поступлении сообщения публикуется TriggerEvent) и системы гарантированного пробуждения (процесс гарантировано не уснет, если есть необработанные сообщения). | ||
| 59 | |||
| 60 | См. пример 2. | ||
| 61 | ))) | ||
| |
1.11 | 62 | |(% style="width:159px" %)Перехват ошибок|(% style="width:1168px" %)Перехват и обработка ошибок, если процесс выкинул exception в движок. Реализацию простого retry с задержкой (создается триггер на следующую попытку). |
| |
1.6 | 63 | |(% style="width:159px" %)Параллельное выполнение|(% style="width:1168px" %)Допускается запуск нескольких раннеров (на разных нодах), работающих с одной таблицей процессов для распределения нагрузки между ними. |
| |
1.9 | 64 | Допускается фильтрация типов процессов между нодами (чтобы нода выполняла только определенные типы процессов, в том числе по приоритету). |
| |
1.6 | 65 | Доступно для раннеров процессов и триггеров. |
| |
1.9 | 66 | \\Также возможна частичная поставка новой версии процесса и этот процесс будет браться в обработку только ограниченным количеством новых нод исполнителей. |
| 67 | \\В перспективе возможны решения с шардированием. | ||
| |
1.33 | 68 | |(% style="width:159px" %)Soft timeout|(% style="width:1168px" %)((( |
| 69 | Возможность указывать soft timeout, который будет мягко приостанавливать цикл (внутри шага процесса), чтобы ограничить общее время транзакции (не делать транзакции долгими (например горизонт postgres)). | ||
| 70 | |||
| 71 | Например: | ||
| 72 | |||
| 73 | 1. родительский процесс может создать | ||
| 74 | 1) N/2 дочерних процессов за первую сессию выполнения (транзакцию) | ||
| 75 | 2) N/2 за вторую сессию выполнения (транзакцию) и уснуть до окончания дочерних процессов. | ||
| 76 | 1. Процесс - групповое действие (когда нужно применить действие к строкам таблицы по указанному фильтру). | ||
| 77 | ))) | ||
| |
1.20 | 78 | |(% style="width:159px" %)Range preload process data|(% style="width:1168px" %)(Необязательно) возможность в начале сессии обработки пакетно предзагружать данные и бизнес сущности для процессов (Range query) из обрабатываемого батча для оптимизации чтения (если используется обработка пакета процессов в одной транзакции). |
| |
1.1 | 79 | ))) |
| 80 | |(% style="width:132px" %)Примеры|(% style="width:1301px" %)((( | ||
| 81 | |(% style="width:32px" %)1|(% style="width:171px" %)Родительский процесс, N дочерних процессов.|(% style="width:1066px" %)((( | ||
| 82 | |(% style="width:870px" %)((( | ||
| |
1.29 | 83 | В данном примере имеется в виду, что дочерние процессы могут выполняться параллельно другу и независимо друг от друга, но в конце должны оповестить родительский процесс о необходимости продолжения обработки. |
| 84 | Если речь идет о каких-либо зависимостях порядка выполнения в дочерних процессах, то это может контролировать дочерний процесс (выделяя группу, которую сейчас можно запустить и ожидая окончания). | ||
| 85 | ))) | ||
| 86 | |(% style="width:870px" %)((( | ||
| |
1.1 | 87 | 1. Родительский процесс создает триггер со счетчиком N, создает и запускает дочерние процессы, засыпает. |
| 88 | 1. Дочерние процесс при завершении публикует TriggerEvent. | ||
| 89 | 1. TriggerConsumerRunner периодически считывает батч TriggerEvent, уменьшает считчик триггера и делает запись в БД. За счет агрегации событий завершения процессов мы уменьшаем нагрузку на БД. | ||
| 90 | 1. Когда все дочерние процессы отработали TriggerConsumerRunner получает значение счетчика 0 и взводит триггер. | ||
| 91 | 1. Триггер пробуждает родительский процесс для дальнейшего выполнения. | ||
| 92 | ))) | ||
| 93 | |(% style="width:870px" %)TriggerEvent публикуются без использования TransactionOutbox напрямую в брокер после коммита транзакции (иначе мы бы нагружали БД). | ||
| 94 | |(% style="width:870px" %)((( | ||
| |
1.8 | 95 | Предполагаем, что основную часть времени система работает стабильно, но допускается ситуация, что транзакция закоммитилась, но TriggerEvent не смогли опубликоваться (остановка сервиса без graceful shutdown, проблемы соединения или работы с брокером сообщений). |
| |
1.1 | 96 | |
| 97 | Для таких случаев создается страхующий триггер (1 общий на тип процесса). Этот триггер запускается периодически и проходится по всем ожидающим процессам, проверяя условие (в реализации можно использовать keyset пагинацию) (в реализации можно использовать join для проверки условия). | ||
| 98 | Этот триггер выполняется периодически с более крупной временной задержкой. В случае обнаружения потери TriggerEvent, он поднимет заклинивший родительский процесс и он будет обработан (но позже). Можно установить этому триггеру низкий приоритет. | ||
| 99 | ))) | ||
| |
4.2 | 100 | |(% style="width:870px" %)[[image:Родительский дочерний процесс. Sequence.jpg]] |
| |
27.6 | 101 | |(% style="width:870px" %)((( |
| 102 | Возможен вариант №2, когда мы просто ставит timerTrigger на условно 1-5 минуту (насколько важна задержка) и перепроверяем условие завершения (по нагрузке на БД будет еще меньше). Из минус, что родительский процесс узнает о завершении дочерних процессов с задержкой (хотя в задержке можно использовать функцию от количества необработанных дочерних процессов, но тогда нужно считать количество). | ||
| 103 | |||
| 104 | * Но тут будет join нагрузка на БД (если шаг проверки выполняется пакетно), иначе будет просто много одиночны запросов на чтение (условно раз в минуту). | ||
| 105 | * Если дочерний процесс остановиться в ошибке, то родительский либо также продолжит крутиться в проверке, либо должен также пробросить ошибку в себя чтобы приостановиться. | ||
| 106 | В случае с решением 1, со страхующим триггером это можно обойти через фильтрующий индекс если мы начинаем идти сразу с таблицы процессов (т.е. процессы с ошибкой сразу будут игнорироваться). | ||
| 107 | * Но все равно, именно данный движек может позволить настроить 2 процесса таким образом, что 1 процесс будет исполняться (1 процесс - 1 транзакция) в параллельном режиме (пока создаются множественные дочерние процессы), 2 процесс будет исполняться в пакетном режиме (N процессов - 1 транзакция) чтобы проверять выполнение условия завершения дочерних процессов через запрос (один пакетный). | ||
| 108 | |||
| 109 | плюсы: меньше пишущей нагрузки (т.к. триггер со счетчиком будет делать условно одну запись на процесс в 5-20 секунд), а тут будет одна запись в 1 минуту на обновление таймера. | ||
| 110 | минусы: больше читающей нагрузки с join (раз 1-5 минуту нужно будет выполнить join незавершенных процессов с дочерними). У решения 1 тоже есть такая нагрузка, но на страхующем триггер (условно раз 10-30 минут). | ||
| |
1.1 | 111 | ))) |
| |
27.6 | 112 | ))) |
| |
6.2 | 113 | |(% style="width:32px" %)2|(% style="width:171px" %)Transaction outbox stream process.|(% style="width:1066px" %)[[image:TransactionOutbox. Sequence.jpg]] |
| 114 | |(% style="width:32px" %)3|(% style="width:171px" %)Stream trigger|(% style="width:1066px" %)((( | ||
| |
27.2 | 115 | |(% style="width:94px" %) |(% style="width:1002px" %)((( |
| 116 | * Позволяет убрать лишние запросы пробуждения процесса (когда он и так запущен). | ||
| |
27.3 | 117 | * Позволяет полностью убрать задержку после остановки процесса (если есть новое сообщения, то он сразу же будет пробужден). |
| |
27.4 | 118 | За счет того, что триггер точно знает, что есть новые сообщения и процесс только что уснул. |
| |
27.2 | 119 | * Вводит 2 типа события, 1 сигнал о новом сообщении (содержит offset значение), 2 - процесс идет спать (содержит offset значение). |
| 120 | * Вводит дополнительное состояние в триггер: максимальный offset сообщения, максимальный offset обработанного процессом сообщения, флаг состояния сна процесса. | ||
| 121 | ))) | ||
| |
6.2 | 122 | |(% style="width:94px" %)Алгоритм триггера.|(% style="width:1002px" %)((( |
| 123 | * При получении события о засыпании процесса: | ||
| 124 | Фиксирует смещение процесса обработки и сравнивает со смещением сообщения. | ||
| 125 | Если все сообщения обработаны, то не пробуждает процесс, иначе пробуждает процесс. | ||
| 126 | * При получении события о новом сообщении: | ||
| 127 | Фиксирует новое наибольшее смещение. | ||
| 128 | Если процесс не спит (по флагу в триггере), то ничего не делает. | ||
| 129 | Если процесс спит (по флагу), то пробуждает процесс. | ||
| 130 | |||
| 131 | Отслеживает смещение обработки процесса и последнего события. | ||
| 132 | Ожидает от процесса события о том, что он все обработал, его последнее смещение и он идет спать. | ||
| 133 | Если есть сообщения со смещением больше чем указал процесс, то делает гарантированное пробуждение процесса. | ||
| 134 | Когда поступает сигнал о новом сообщении (от отправителя сообщения), то обновляет данные о максимальном смещении и пробуждает процесс, если он спит | ||
| |
1.1 | 135 | ))) |
| |
6.2 | 136 | |(% style="width:94px" %) |(% style="width:1002px" %)TODO: |
| 137 | ))) | ||
| 138 | ))) | ||
| |
1.1 | 139 | |
| |
27.5 | 140 | ---- |
| 141 | |||
| 142 | ==== Внутренние ссылки: ==== | ||
| 143 | |||
| 144 | ====== Дочерние страницы: ====== | ||
| 145 | |||
| 146 | {{children/}} | ||
| 147 | |||
| 148 | ====== Обратные ссылки: ====== | ||
| 149 | |||
| 150 | {{velocity}} | ||
| 151 | #set ($links = $doc.getBacklinks()) | ||
| 152 | #if ($links.size() > 0) | ||
| 153 | #foreach ($docname in $links) | ||
| 154 | #set ($rdoc = $xwiki.getDocument($docname).getTranslatedDocument()) | ||
| 155 | * [[$escapetool.xml($rdoc.fullName)]] | ||
| 156 | #end | ||
| 157 | #else | ||
| 158 | No back links for this page! | ||
| 159 | #end | ||
| 160 | {{/velocity}} | ||
| 161 | |||
| 162 | ---- |