Диллема обработки сообщений

Версия 5.3 от Alexandr Fokin на 2024/02/02 10:03

 

Ситуация:
Имеется очередь, из которой приложение читает данные и обрабатывает их. Рассмотрим пример, что приложение имеет следующий цикл обработки сообщения:

1) Взять сообщение из очереди
2) Попытаться выполнить некоторый набор действий на основе данных из сообщения.
Отметим, что обработка сообщения может завершиться как успешно, так и с ошибкой.

Вариации:

1]
1) Получаем сообщение
2) Выполняем коммит сообщения (при следующем чтении на вход пойдет следующее сообщение)
3) Выполняем обработку

2]
1) Получаем сообщение
2) Выполняем обработку
3) Если п.2 выполнен успешно, то выполняем коммит сообщения (при следующем чтении на вход пойдет следующее сообщение)

Возможные проблемы
1) При потходе 1, мы теряем сообщение, в случае если его обработка не завершилась успешно.
2) При потходе 2, в случае, если после выполнения 2 пункта наше приложение упадет (не успев выполнить пункт 3), то при повторном запуске мы обработаем то-же самое сообщение второй раз.

Вопросы
1) Является ли повторная обработка одного и того же сообщения допустимой для нашей системы.
2) Является ли потеря данных из одного из сообщений критичной для нашей системы.
3) Возможно в нашей системе производитель сообщение, генерирует сообщени3) Возможно в нашей системе производитель сообщение, генерирует сообщен3) Возможно в нашей системе производитель сообщение, генерирует сообщение повторно через некоторой промежуток времени, если фиксирует, что предыдущее сообщение не было обработано.

Более надежное, но более тяжелое решение:
Использование потхода номер 2 совместно с каким-либо более продвинутым механизмом транзакций. Т.е в случае падения приложения транзакция не будет завершена успешно.
Но есть риск если у нас выполняются 2 действия:
1) коммит транзакции в базе, 2) коммит сообщения. (или в порядке 2, 1)
В случае падения приложения между указанными шагами, мы все равно можем получить
либо потерю сообщения (закоммитили сообщение, но не завершили транзакцию),
либо повторную обработку (завершили транзакцию, но не закоммитил сообщение).
Хоть и вероятность такого события в целом крайне мала. (зависит от системы)

 

Замечание: на текущий момент отношу проблему к Dual write problem.
По хорошему у каждого запроса или хотя бы сообщения должен быть уникальный ключ. Использую его, транзакцию, таблицу с уникальным индексом можно добиться гарантии, что сообщение будет обработано только единожды.

Возможен вариант, когда сообщение просто записывается в БД в статусе ожидает обработку. И фоновый обработчик разбирает таблицу и обрабатывает необходимые строки.

  

 

Теги:
Создал(а) Alexandr Fokin 2020/08/09 15:30