DevOps
Server Administration
System administration
Data storage
Comments 9
0
Quis custodiet ipsos custodes? Кто будет мониторить мониторинг?

Самый важный вопрос о жизни, Вселенной и вообще)
+1
Это же очевидно: мониторинги как маркеры — два могут мониторить вообще всё.
+1
и теперь вопрос ниже пояса, что делать, если мониторинг живет на той же инфраструктуре?
+1
Очевидно, что два мониторинга должны быть независимы, как и каналы доставки алармов.
0
считать потенциальные потери в случае Х или пилить «микромониторинг» на сервисе «сбоку»
0
Добавить оповещение «В багдаде все спокойно». Естественно по СМС автору системы. А он уже пусть настраивает телефон на алерты в будильнике, если пропущено такое сообщение.
+1
При падении туннеля генерируется куча алертов о недоступности серверов, пришлось настраивать зависимости.

Как знакомо. Я немного отошел от администрирования, но помню использовал заббикс 2.4 — там зависимости весьма примитивны (между триггерами, IIRC). Ситуация у нас похожая видимо — site-to-site vpn, и это была самая большая боль во всем заббиксе, все остальное очень нравилось. В новых версиях что-нибудь сделали с этим? Зависимости на более высоких уровнях?
0
да, в основном доставлял нестабильный интернет на одной из площадок. за давностью лет(в районе 2.2-2.4 дело было) уж не помню деталей, обошлись существующим механизмом зависимостей и zabbix-proxy
0
У нас в компании есть отдел мониторинга. При возникновении алертов они оповещают отдел поддержки. Далее те, если это прописано в инструкциях, пытаются закрыть алерт. Если же не прописано — отправляют сообщение в общий чат мониторинга в телеграмме, в котором присутствую программисты. И далее программисты уже разбираются с алертом. Если же алерт очень важный (перестал идти трафик от ключевого партнера, например), то тогда уже мониторинг напрямую звонит менеджерам или программистам. На моем опыте это очень редкий случай, буквально пару раз в год.
Only those users with full accounts are able to leave comments. , please.