В Pingera мы постоянно стремимся предоставить инженерам и разработчикам инструменты, которые не просто мониторят, а помогают принимать взвешенные и своевременные решения. Сегодня мы представляем важное обновление, которое значительно повышает надёжность ваших данных: автоматический повтор проверок. Эта функция разработана специально для того, чтобы снизить количество ложных срабатываний и минимизировать «шум» в системе мониторинга, позволяя вам сосредоточиться на реальных проблемах.
Что такое автоматический повтор и зачем он нужен
Представьте: вы получаете уведомление о сбое. Сердце ёкает, в голове проносятся мысли о том, что "всё упало". Вы начинаете судорожно проверять логи и другие системы, но через минуту видите, что проверка уже "зелёная". Знакомо?
Ложноположительные срабатывания (false positives) — это настоящий бич мониторинга. Они могут быть вызваны временными сетевыми задержками, кратковременными сбоями на стороне DNS-провайдера или даже микро-перегрузкой на вашем сервере. Каждое такое уведомление отвлекает инженеров, заставляет тратить время на диагностику несуществующих проблем и, что самое неприятное, снижает доверие к системе мониторинга в целом.
Чтобы решить эту проблему, мы добавили функцию автоматического повтора. Теперь, если проверка не проходит с первого раза, наша система не спешит поднимать тревогу. Она подождёт 5 секунд и запустит её снова.
Как это работает:
Первый сбой: Если проверка не прошла, ей присваивается статус "Нарушение" (degraded).
Автоматический повтор: Через 5 секунд система выполнит проверку снова.
Второй сбой: Если повторная проверка также завершится неудачно, только тогда проверка получит статус "Сбой" (failed), и вы получите уведомление.
Успешный повтор: Если повторная проверка прошла успешно, её статус вернется к "OK", и вы не получите никаких ложных уведомлений.
Это простое, но эффективное изменение позволяет отфильтровать случайные и кратковременные сбои, оставляя только реальные, требующие вашего внимания проблемы.
Как это выглядит в интерфейсе?
Мы позаботились о том, чтобы вы могли легко управлять этой функцией. По умолчанию автоматический повтор включен для всех новых и существующих проверок, но вы можете отключить его в любой момент.
Вот как это выглядит в настройках проверки:
А вот как выглядит результат проверки, которая не прошла с первого раза, но успешно завершилась при повторном запуске:
Как видите, в истории проверки теперь будет явно видно, что первый запуск был неудачным, но система не стала создавать инцидент, а выполнила повторную попытку.
Автоматизация через API
Для тех, кто использует наш API для управления проверками, мы также добавили возможность контролировать эту функцию. Просто добавьте поле retry_enabled со значением true или false в параметры вашей проверки.
Пример API-запроса для включения автоматического повтора:
Автоматический повтор — это не просто новая функция, это важный шаг на пути к более надёжному и проактивному мониторингу. Он снижает информационный шум, повышает доверие к системе и позволяет инженерам сосредоточиться на реальных проблемах. Мы в Pingera верим, что мониторинг должен быть точным, полезным и не отвлекать вас по пустякам. Попробуйте эту функцию уже сегодня и почувствуйте разницу!