Как стать автором
Обновить

Комментарии 12

А почему при расчёте статистики используется оптимистичный аптайм? Просто что бы число получше выглядело?
Интервал между неуспешной и успешной проверкой — это такой себе «сайт шреденгера». Между этими двумя проверками очевидно, что сайт поднялся, но сказать в какой именно момент, нельзя. Поэтому, чтобы не занижать аптайм, мы условно считаем, что подъем произошел сразу за последним падением.
Интересно, что пессиместичный аптайм считается неверно. Упасть могло сразу после предыдущей проверки.
Получается, что надо считать простой по проверкам + 2 периода проверки.
Это уже немного пароноидальный сценарий :-)
Основная задача пессимистичного сценария, это сообщить интервал между первым падением и подъемом.
А если и дальше пессимизировать, то можно предположить что даже между успешными проверками, сайт все время лежит. Поэтому нужно остановится на некотором адекватном уровне пессимизма.
Причем тут параноидальность?
Выделяют 3 уровня оценки.
В вашем случае:
Оптимистичный — сайт лежал строго между проблемными проверками.
Реалистичный — Оптимистичный +1 период проверки. При желании это можно доказать математически.
Пессимистичный — Оптимистичный +2 периода проверки.

Вот и получается, что ваша пессимистическая оценка соответствует реалистичной оценке.
Все верно. Но вопрос, куда эти три значения аптайма девать?
Так туда же, куда и сейчас.
Только я бы предложил реалистичную оценку в статистику.
А оптимистичную/ реалистичную / пессимистичную — в нотификацию.

А делать или нет — уже другой вопрос. Только сейчас статистика строится по оптимистичному сценарию. А это накапливает ошибку при увеличении количества периодов недоступности. Причем падение в рамках одного периода проверки статистика вообще не заметит.
В принципе можно подумать и над таким вариантом. Про накопление ошибки — сейчас позиция такая, при любых «спорных» моментах, лучше показать более высокое значение аптайма, чем более низкое. Такая себе презумция невиновности. Поэтому нельзя сказать что это ошибка, это фича такая.
У меня была недавно проблема с потерей пакетов. От 50 до 70% терялось.
По факту, пользоваться таким сайтом нельзя. Долго грузится, висит и прочие проблемы.
Мониторинг буквально сходит с ума. Каждую минуту уведомление. Down / Up / Down / Up / Down / Up / Down / Up.

Но согласно оптимистичной оценке, я имею 100% аптайма.
У Вас интервал между проверками одинаковый или после падения/поднятия он уменьшается до минимума, постепенно увеличиваясь?
Одинаковый.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий