Блог и новости

Борьба с False Positives: Как автоматический повтор проверок в Pingera делает ваш мониторинг надежнее

Проверки Новости
В Pingera мы постоянно стремимся предоставить инженерам и разработчикам инструменты, которые не просто мониторят, а помогают принимать взвешенные и своевременные решения. Сегодня мы представляем важное обновление, которое значительно повышает надёжность ваших данных: автоматический повтор проверок. Эта функция разработана специально для того, чтобы снизить количество ложных срабатываний и минимизировать «шум» в системе мониторинга, позволяя вам сосредоточиться на реальных проблемах.

Что такое автоматический повтор и зачем он нужен

Представьте: вы получаете уведомление о сбое. Сердце ёкает, в голове проносятся мысли о том, что "всё упало". Вы начинаете судорожно проверять логи и другие системы, но через минуту видите, что проверка уже "зелёная". Знакомо?
Ложноположительные срабатывания (false positives) — это настоящий бич мониторинга. Они могут быть вызваны временными сетевыми задержками, кратковременными сбоями на стороне DNS-провайдера или даже микро-перегрузкой на вашем сервере. Каждое такое уведомление отвлекает инженеров, заставляет тратить время на диагностику несуществующих проблем и, что самое неприятное, снижает доверие к системе мониторинга в целом.
Чтобы решить эту проблему, мы добавили функцию автоматического повтора. Теперь, если проверка не проходит с первого раза, наша система не спешит поднимать тревогу. Она подождёт 5 секунд и запустит её снова.
Как это работает:
  • Первый сбой: Если проверка не прошла, ей присваивается статус "Нарушение" (degraded).
  • Автоматический повтор: Через 5 секунд система выполнит проверку снова.
  • Второй сбой: Если повторная проверка также завершится неудачно, только тогда проверка получит статус "Сбой" (failed), и вы получите уведомление.
  • Успешный повтор: Если повторная проверка прошла успешно, её статус вернется к "OK", и вы не получите никаких ложных уведомлений.
Это простое, но эффективное изменение позволяет отфильтровать случайные и кратковременные сбои, оставляя только реальные, требующие вашего внимания проблемы.

Как это выглядит в интерфейсе?

Мы позаботились о том, чтобы вы могли легко управлять этой функцией. По умолчанию автоматический повтор включен для всех новых и существующих проверок, но вы можете отключить его в любой момент.
Вот как это выглядит в настройках проверки:
Включить или выключить авто-повтор проверки в Pingera
А вот как выглядит результат проверки, которая не прошла с первого раза, но успешно завершилась при повторном запуске:
Авто-повтор проверки - статус Нарушение для первого сбоя
Как видите, в истории проверки теперь будет явно видно, что первый запуск был неудачным, но система не стала создавать инцидент, а выполнила повторную попытку.

Автоматизация через API

Для тех, кто использует наш API для управления проверками, мы также добавили возможность контролировать эту функцию. Просто добавьте поле retry_enabled со значением true или false в параметры вашей проверки.
Пример API-запроса для включения автоматического повтора:
{
	"type": "api",
	"name": "Some API",
	"url": "https://myurl.ru",
	"interval": 45,
	"timeout": 30,
	"parameters": {
		"http_request": {
			"method": "GET"
		},
		"retry_enabled": true
	}
}

Заключение

Автоматический повтор — это не просто новая функция, это важный шаг на пути к более надёжному и проактивному мониторингу. Он снижает информационный шум, повышает доверие к системе и позволяет инженерам сосредоточиться на реальных проблемах. Мы в Pingera верим, что мониторинг должен быть точным, полезным и не отвлекать вас по пустякам. Попробуйте эту функцию уже сегодня и почувствуйте разницу!