В мире высоконагруженных сервисов техническое обслуживание и обновления — неизбежная часть работы. Для операционных команд управление этими процессами и, что не менее важно, коммуникация с пользователями, являются ключевыми задачами.
Мы в Pingera считаем, что проактивность в информировании — это основа доверия. Поэтому мы добавили функциональность «Запланированные работы» на вашу Статус Страницу, чтобы вы могли управлять ожиданиями пользователей и снижать нагрузку на поддержку.
Что такое Запланированные работы и почему это важно для инженера?
Запланированные работы — это особый тип инцидента, который позволяет заранее уведомить пользователей о предстоящем плановом обслуживании или обновлении, которое может повлиять на доступность сервиса.
Для инженеров это не просто маркетинговый инструмент, а элемент контроля:
- Учет аптайма: Время запланированных работ не учитывается при расчете аптайма затронутых компонентов. Это позволяет сохранить чистую статистику доступности сервиса и избежать ложных срабатываний SLA.
- Снижение негатива: Предупрежденный пользователь воспринимает временную недоступность гораздо спокойнее, чем внезапный сбой. Это помогает снизить поток обращений в службу поддержки.
- Автоматизация: Возможность настроить автоматическое изменение статусов компонентов и отправку уведомлений освобождает инженеров от рутинных операций во время самого окна обслуживания.
⚙️ Жизненный цикл и Автоматизация
Функционал «Запланированные работы» покрывает весь цикл планового обслуживания, от анонса до завершения.
Стадии работ
Запланированные работы проходят через несколько ключевых стадий:
- Запланировано: Начальное состояние. Отправляются предварительные уведомления (напоминания). Компоненты работают штатно.
- В процессе: Работы начались. Компоненты могут автоматически перейти в статус "Запланированные работы".
- Проверка (опционально): Промежуточная стадия, если требуется ручная верификация перед закрытием инцидента.
- Завершено: Работы завершены. Компоненты автоматически возвращаются в статус "Работает штатно".
Ключевые настройки автоматизации
Вы можете настроить систему так, чтобы она работала как часы, минимизируя ручное вмешательство во время работ:
- Управление статусами компонентов: Автоматический перевод компонентов в статус 'Запланированные работы' при начале, и восстановление в 'Работает штатно' по завершении.
- Уведомления и напоминания: Настройка интервалов напоминаний (например, 48h,24h,1h). Система может автоматически уведомить подписчиков о начале и завершении работ.
- Жизненный цикл инцидента: Автоматическое изменение статуса с 'Запланировано' на 'В процессе' и затем на 'Завершено'.
💡 Примеры использования: Сценарии для SRE
1. Плановая миграция базы данных (Сценарий с частичной недоступностью)
Цель: Перенести основную базу данных на более производительный кластер. Ожидается кратковременная недоступность API.
- Название: Миграция основного API-сервиса
- Описание: В связи с ростом нагрузки мы обновляем наш основной кластер баз данных. Во время работ возможна недоступность API.
- Затронутые компоненты: API (перевести в статус "Запланированные работы"), Фронтенд (оставить "Работает штатно").
Автоматизация:
- Напоминания: За 48 часов, 24 часа и 1 час до начала.
- Начало: Автоматически перевести API в статус "Запланированные работы" и отправить уведомление.
- Завершение: Автоматически восстановить API в "Работает штатно" и закрыть инцидент.
2. Применение патчей безопасности (Сценарий с контролем)
Цель: Установка критических патчей безопасности на все серверы приложений. Требуется ручная проверка после развертывания.
- Название: Ежемесячное обновление безопасности
- Описание: Плановое применение патчей. Возможны кратковременные перебои, но сервис должен быстро восстановиться.
- Затронутые компоненты: Все основные сервисы (перевести в статус "Запланированные работы").
- Жизненный цикл: Использовать ручное управление для перехода в стадию "Проверка" после завершения скрипта развертывания, чтобы SRE-инженер мог убедиться в корректности работы сервисов перед окончательным закрытием.
🧑💻 Интеграция через API
Для инженеров, которые ценят автоматизацию, весь функционал доступен через API Pingera. Вы можете интегрировать создание и управление запланированными работами прямо в ваши CI/CD пайплайны или системы управления инцидентами.
Создание работ через API
Вы можете использовать стандартный endpoint создания инцидента с дополнительными полями, чтобы, например, автоматически создать запланированные работы сразу после мерджа ветки с релизом.
Пример запроса на создание запланированных работ:
- scheduled_for и scheduled_until: Определяют окно обслуживания.
- reminder_intervals: Управляет отправкой предварительных уведомлений.
- scheduled_auto_in_progress и scheduled_auto_completed: Включают автоматическое изменение статусов инцидента.
- auto_transition_to_maintenance_state: Автоматически переводит компоненты в статус "Запланированные работы".
Детальное описание всех полей доступно в нашей документации по API.
Заключение
Инструмент «Запланированные работы» в Pingera — это не просто новый раздел на странице, это система для контроля и коммуникации, которая помогает SRE-командам выполнять плановое обслуживание, сохраняя при этом высокие показатели аптайма и демонстрируя прозрачность перед пользователями. Используйте автоматизацию, чтобы сосредоточиться на техническом процессе, пока наша система берет на себя рутину информирования.
Готовы обеспечить безупречное информирование о плановых работах? Создайте вашу первую Запланированную работу на app.pingera.ru!