Непрерывный (в рамках рабочего времени, если отдельный SLA не выбран) контроль состояния основных сервисов:
- настройку и ведение мониторинга доступности ключевых HTTP/HTTPS/gRPC API-эндпоинтов;
- контроль ответа сервисов (код ответа, время отклика);
- анализ логов приложений и системных журналов на предмет ошибок и критичных предупреждений;
- оперативное уведомление Заказчика при выявлении сбоев, деградации производительности или недоступности сервисов;
- подготовку кратких отчетов по инцидентам и замеченным аномалиям (по запросу Заказчика).
Режим:
- мониторинг в рабочее время: пн-пт, с 10:00 до 18:00 (мск);
- уведомления по согласованным каналам (email, мессенджер, тикет-система).