Как стать автором
Обновить

Комментарии 16

Спасибо за статью. В свое время то же придумывал велосипеды для HPE 3PAR, IBM Storwize и какого-то барахла от Brocade. Соглашусь на счет вендорского ПО — это неюзабельное дно (прошу прощения если задел чьи-нибудь чувства).
Планируете ли выкладывать плагины в общий доступ или может уже есть открытая репа на GH?
Выкладывать в открытый доступ не планируем. Плагины устанавливаются на возмездной основе. Если у вас остались еще какие-нибудь вопросы, то можете написать мне на почту.
Спасибо за статью!
Скажите, а вы мониторите время отклика на датасторах? Именно со стороны vmware, а не луна.
Да, наш плагин позволяет добавлять любые доступные метрики любого объекта VMware.

А с коллегами делитесь или это просто рассказ о собственной системе мониторинга?:)

Плагины наша разработка, публичить их не планируем. Можете мне на мэйл написать, если есть вопросы, постараюсь ответить.

Отлично, спасибо, обязательно напишу!

А расскажите на базе чего делали визуализацию топологии? Zabbix — мощный инструмент, но требует множества пристроек сбоку: от панели событий до разных визуализаций.
Визуализация топологии строится скриптом, который собирает все данные из заббикса, анализирует, рисует линки и вешает на них триггеры для подсветки проблем. Сами данные собираются в итемы со строгим именованием ключей
Я смотрю SAN-свитчи тоже мониторите. А какие характеристики? Или только доступностью обходитесь?
Собираем много всего – доступность, метрики производительности, ошибки на портах (то, что выводит portperfshow и porterrshow), инвентори свичей (модели, серийники, прошивки,…), инвентори портов (WWN, скорость, тип,…), информацию о подключенных девайсах (WWN,zone alias). Также зонинг – конфиги, зоны, алиасы. В виде красивой примочки получает карта сети, как на картинке.

В результате можно настроить всяких разных интересных триггеров, даже на обновление прошивки, изменение зон и алиасов, смену скорости порта, новом подключенном устройстве и т.д и т.п. Если упал порт или трафик большой, можно в письме дать инфу, что на этом порту висит – сразу понятно, кто генерит трафик и куда смотреть дальше.

Может ещё глянуть продукт STOR2RRD, мониторинг достаточно большого количества разных СХД, бесплатная версия почти полносьтю полнофункциональна. Хоть там все и очень просто сделано

Отличный инструмент STOR2RRD, из коробки почти все может, а если надо чуть больше есть платная редакция
Чем плох бесплатный stor2rrd?
Утилитка отличная, ничего плохого про нее сказать не могу. Знаю заказчиков, которые ей пользуются.

Просто перед нами стоит намного больше задач, чем позволяет решить stor2rrd и любой подобный инструмент. Одна из них – уход от зоопарка ПО мониторинга и множества интерфейсов. Так как заббикс очень популярен, то эту задачу мы решили для большинства наших заказчиков.

Потом мы следим не только за состоянием и производительностью, но также собираем инвентори и топологию – это модели, серийники, партийники, прошивки, подключения, зависимости и много всего остального. В результате, если упадет порт, в письме придет информация, что к нему подключено. Если выйдет из строя жесткий диск, в письме будет информация о партийнике и модели, чтобы сразу заказать новый. Из топологии можно строить ресурсно-сервисные модели и иметь дерево здоровья сразу всего сервиса. Карты, которые приведены в статье, тоже строятся не просто так – для этого нужно собрать правильные данные со всех компонент инфраструктуры.
Мне кажется от зоопарка в системах мониторинга не уйти или принять единую систему с условием, что она не будет контролировать инфраструктуру полностью.
Недаром вендоры для своего оборудования и платформ предлагают собственные решения.
zabbix не заменит hp system insight manager, особенно при выходе новой линейки оборудования, ms scom лучше мониторит решения от ms ( sql, sharepoint и т.д.) и т.д.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий