Короткий ответ
Падение сайта не всегда выглядит как полный отказ сервера. Иногда домен открывается, HTTP-код остается успешным, но на странице уже видна заглушка веб-сервера, ошибка прокси или текст о временной недоступности.
Поэтому мониторинг должен проверять не только факт ответа, но и смысл страницы: нужный контент присутствует, а признаки аварии отсутствуют.
Что проверять в первую очередь
Начните с базовых сигналов: сайт отвечает, код ответа успешный, SSL-сертификат действителен, а время последней проверки свежее. Если проверка настроена раз в минуту, в кабинете должна быть свежая отметка времени.
После этого проверьте содержимое страницы. Для главной страницы обычно полезно требовать наличие стабильного элемента, например тега `body` или части заголовка, и запрещать типовые тексты ошибок веб-сервера.
Почему одной проверки доступности мало
Пользователь оценивает не HTTP-код, а результат в браузере. Если вместо сайта открылась дефолтная страница nginx или сообщение о временной недоступности, это уже инцидент, даже если соединение технически состоялось.
Web-Puls фиксирует такие события в истории, показывает uptime за месяц и отправляет уведомления при падении и восстановлении.
Как реагировать на инцидент
Сначала посмотрите причину в логах падений и время последней проверки. Затем проверьте, совпадает ли проблема с релизом, изменением DNS, окончанием SSL-сертификата или ошибкой на стороне прокси.
Когда сайт восстановится, важно сохранить историю: по ней видно, сколько длился простой и насколько часто повторяется проблема.