Как стать автором
Обновить

Комментарии 3

Это привело к генерации множества ложных инцидентов от уже несуществующего оборудования.

а у вас процедура процесса вывода оборудования из эксплуатации не содержит пункта «Снять с мониторинга»?
Это не был как таковой процесс вывода оборудования из эксплуатации. Это было разделение одной инфраструктуры на две. Не всегда отключение происходило с нашей стороны. Свою роль сыграли и сжатые сроки. Когда вы меняете маршрутизацию сети с маской /24, отключение всех триггеров мониторинга, который смотрел в нее, может занять много времени. К тому же, не всё отключалось таким образом.
Оборудование снималось с мониторинга, просто что-то было легче сделать подобным образом.
Я обычно юзаю заббикс апи и поднимаю просто больше рнр бекендов под апи, а нджинксу пофиг на сколько бекендов балансировать. Лишь бы бд справлялась, но там тоже всё решается количеством оперативки.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий