Pull to refresh
  • by relevance
  • by date
  • by rating

Пишем свой плагин для nagios

System administration
В своей повседневной работы я очень активно использую nagios. Как мне кажется, это очень мощная система для мониторинга серверов. Можно мониторить загрузку сервера, доступность разных серверов и тд и тп.

Для нагиоса есть очень много плагинов. Большое собрание плагинов находится по адресу nagiosplugins.org. Можно найти подходящий для себя, поставить и наслаждаться жизнью. Но что же делать если ни один плагин не устраивает вас по функционалу? Да ничего. Напишем свой. Это очень просто.

Итак начнем.

Первое что нам нужно знать для написания простейшего плагина это как работает нагиос на базовом уровне.

Он парсит свой конфиг, находит там команду запуска какого-либо плагина и запускает. Например, php -f checkServer.php. checkServer.php выполняет какую-то свою работу по проверке сервера и отдаёт в ответ статусное сообщение и код завершения работы.

Нагиос понимает 4 кода завершения работы
  • 0 — Все ок.
  • 1 — Предупреждение
  • 2 — Критическая ошибка
  • 3 — Что-то неизвестное случилось

Статусное сообщение это любая информация которая выводится скриптом на стандартный вывод.

И так сам скрипт простейшего плагина под nagios(на php).

define( "STATUS_OK", 0 );
define( "STATUS_WARNING", 1 );
define( "STATUS_CRITICAL", 2 );
define( "STATUS_UNKNOWN", 3 );

$checkFilePath = 'file';
if(file_exists($checkFilePath))
{
echo 'File exists. Everything is ok';
exit(STATUS_OK);
}

echo 'File does not exists';
exit(STATUS_CRITICAL);


вот и все — подключаем в нагиос и он будет проверять существует ли файл или нет. Конечно же Вы можете организовать любую проверку бизнес логики своего проекта, вплоть до автоматического тестирования через phpunit.
Total votes 31: ↑22 and ↓9+13
Views9.2K
Comments 6

Графики в Nagios — зачем и чем

Lumber room

Введение.


Выбрав Nagios в качестве системы мониторинга, получаем систему слежения за качественными характеристиками окружения и историю изменения состояний. И, если посмотреть текст сообщения пробника на данный момент и во время прошлых изменений состояния еще возможно, то данные по периодам между изменениями отсутствуют как класс. При любой более-менее активной работе с мониторингом, возникает желание просмотра истории изменений количественных характеристик тоже, что стандартный Nagios обеспечить не может. Можно, конечно, продублировать все необходимые пробники в тот же Cacti, но это как минимум дополнительные накладные расходы как на конфигурирование так и на машину с поллером. К счастью, Nagios умеет переложить это на плечи пользователя, обеспечивая механизм так называемых «данных производительности» (performance data). В данной статье рассматривается одно из решений по сбору и визуализации полученных данных – Pnp4Nagios.
Читать дальше →
Total votes 6: ↑4 and ↓2+2
Views5.6K
Comments 5

Nagios — помощник в мониторинге сервисов и хостов

Lumber room
Существуют различные бесплатные системы мониторинга состояния систем и сети такие как: Munin, Zabbix и т.д. Я же хочу поделиться с IT сообществом примером настройки системы мониторинга Nagios на операционную систему Arch Linux.

Приведенный ниже пример установки Nagios производился на дистрибутив Arch linux x64, но так же данный материал можно использовать для Arch i686.

Читать дальше →
Total votes 7: ↑4 and ↓3+1
Views6.3K
Comments 1

Обработка сообщений ядра

Webzilla corporate blog

Предисловие


Страшная сказочка:
EDAC MC0: 1 CE read ECC error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0)
EXT4-fs error: ext4_wait_block_bitmap:445: Cannot read block bitmap
Out of memory: Kill process 95 (sshd) score 31 or sacrifice child
CMCI storm detected: switching to poll mode
page allocation failure: order:1, mode:0x4020
invalid opcode: 0000 [#1] SMP

Неприятно выглядит, правда? Список может быть очень длинным очень длинный. В этой статье я расскажу как с этим жить и что мы с ним сделали.

Часть из этих сообщений в примерах выше заставит вас погрузиться в бездны современной архитектуры процессоров («CMCI storm», удачи в поиске дороги назад, из дебрей интернетов)… Cтранные вещи в ядре могут нарушать ожидания о том, как работают компьютеры, делая последующую отладку очень затруднённой. Отсутствие знания о том, что случилось может даже оставить с грустным ответом «какая-то неведомая фигня, ребутнули, вроде, прошло».
Читать дальше →
Total votes 30: ↑29 and ↓1+28
Views15K
Comments 13

SMS-уведомления из Nagios малой кровью

System administration
Стоял как-то раз админ в курилке и думал — а как бы ему так в нерабочее время вдали от компьютера и интернетов узнать, что на каком-то из его серверов проблема возникла. Можно конечно посадить студента за монитор с Nagios, чтоб он если что звонил админу и говорил «Тут красненькое что-то появилось»… Стоп. Звонил. На мобильный. Нафиг студента, SMS можно получать. На этом мысль остановилась и админ пошёл пить кофе. Потом вернулся и сел за рабочее место, где в браузуре был загружен Google Calendar… и решение пришло само.
Решение
Total votes 33: ↑30 and ↓3+27
Views16K
Comments 120

Nagios: оповещение с помощью SMS без Google Calendar

System administration
Прочитал топик SMS-уведомления из Nagios малой кровью и удивился почему автор называет это «малой» кровью…
Хочу рассказать про свой способ оповещения при помощи SMS, при котором время получения сообщения как минимум меньше и как максимум вездесущий Google не узнает номера вашего мобильного телефона.
Читать дальше →
Total votes 12: ↑7 and ↓5+2
Views6.6K
Comments 17

Nagios + SMS используя мобильный телефон

System administration
Несколькими постами раньше уже были темы об использовании SMS уведомлений в Nagios. Сегодня я расскажу ещё об одном способе уведомлений. Нижеописанный способ несколько надёжнее описанных ранее, но и требует некоторых денежных вложений. Он полезен в том случае, когда какие-то из уведомлений являются критически важными (как, например, выход кондиционера из строя или увеличение влажности).

Способ заключается использовании мобильного телефона с корпоративным тарифом (дабы деньги на телефоне не кончились неожиданно).

Физически подключается к серверу по bluetooth, com или usb. На уровне ПО мы будем использовать два скрипта: один из них умеет отправлять sms, второй проверяет статус мобильной сети. Если мобильная сеть недоступна, то nagios отправляет сообщение на email.

Оба скрипта написаны на python и используют библиотеку gammu для подключения к телефону.
Читать дальше →
Total votes 20: ↑18 and ↓2+16
Views5.6K
Comments 17

Nagios мониторинг баланса мобильного телефона

Website development
Sandbox

Для чего это нужно


Когда в семье число мобильных телефонов становится более 3-х, назревает вопрос мониторинга баланса и оповещения, когда баланс приближается к критической отметке. Есть много средств для мониторинга баланса, но зачем городить огород, когда под рукой есть незаменимый Nagios (так получилось что и дома у меня есть свой мониторинговый сервер, его основная задача наблюдать за состоянием серверов организаций которые я администрирую в нерабочее время). Данное решение также подойдет для мониторинга баланса корпоративного лицевого счета.
Читать дальше →
Total votes 89: ↑88 and ↓1+87
Views9.5K
Comments 40

Оповещения из Nagios телефонным звонком

System administration
Sandbox
До сих пор кажется невероятным, что сервер может мне позвонить в случае проблем, но в действительности реализация оказалась даже проще, чем я думал. Своим решением спешу поделиться.
Читать дальше →
Total votes 43: ↑43 and ↓0+43
Views9.2K
Comments 37

Оповещение от Nagios по телефону через Asterisk

System administration
Прочитал вчера статью Google translate+Asterisk IVR и подумал — «Клёво! Можно пользоваться для быстрого создания звуковых файлов при заведении новых хостов и сервисов в Nagios!».

Затем задался вопросом, а описано ли где-то как настроить оповещения по телефону для Nagios? Погуглив немного я нашел пару статей, прочитал их и понял, что решения описанные там обладают рядом недостатков:
  • Nagios и Asterisk должны быть установлены на одном сервере.
  • Требуется локальная установка движка по синтезу речи.
  • Телефон админа «зашит» в скрипт и он получает ВСЕ уведомления.
Вот я и решил поделиться своим решением, которое использую уже не первый год.
Читать дальше →
Total votes 19: ↑19 and ↓0+19
Views6.8K
Comments 14

Мониторинг распределенной и облачной инфраструктуры

1С-Битрикс corporate blog
В прошлой статье я обзорно прошелся по различным типам мониторинга простых веб-проектов и веб-сайтов, когда от сайта не требуется уровня надежности 99,99%, когда время реакции может составлять часы или дни. В общем, когда все просто. В этой статье я раскрою механизмы мониторинга облачной инфраструктуры, когда простого сигнала доступен/не доступен совсем не достаточно, чтобы понять, в чем проблемы, и как их оперативно решить. Или же когда решение проблемы может требовать большого количества действий, автоматизировать которые можно только частично.

Обычно уровень надежности инфраструктуры проекта позволяет оставить время реакции на возникшие проблемы таким же — часы или даже дни. Но при этом есть ряд мест, решения по которым должны приниматься в (полу)автоматическом режиме, чтобы исключить человеческий фактор и свести время простоя системы к минимуму. О триггерах таких решений речь пойдет ниже. Хочу сразу отметить, что почти все описанные технологии мониторинга используются в новом облачном сервисе социального интранета — Битрикс24.
Читать дальше →
Total votes 50: ↑48 and ↓2+46
Views14K
Comments 9

Отправляем уведомления Nagios в чат Skype

Configuring LinuxSystem administration
Sandbox
Итак, однажды в голову пришла мысль, что было бы здорово получать уведомления от Nagios в skype.
Вкратце: используем Skype4Py, скриптом отправляем уведомления.
Жирный минус: skype не работает без иксов.
Плюс: уменьшение времени реакции на проблемы.

Интересно? Подробности под катом.
Читать дальше →
Total votes 25: ↑22 and ↓3+19
Views4.8K
Comments 19

SMS-уведомления от nagios средствами clickatell.com и монитор сайтов на bash

System administration
Sandbox
image

Добрый день, товарищи


Как и всем кто имеет дело с удалёнными системами, мне понадобилось мониторить множество машин и сервисов на них. Пролистав описания и мануалы нескольких программ, остановился на Nagios. Множество статей и примеров по нему и очень богатая настройка оказалось то что нужно. И вот решил поделиться несколькими моментами в реализации и конфигурирование самописного плагина, написанного на Bash и системы оповещения по sms с использованием clickatell.com.
Читать дальше →
Total votes 14: ↑11 and ↓3+8
Views13K
Comments 5

Ganglia и Nagios. Взаимодополняющий удаленный мониторинг

System administration
Sandbox
Tutorial
Все системные администраторы рано или поздно сталкиваются с проблемой мониторинга рабочих серверов. Для решения этой проблемы существует целый зоопарк разнообразных путей. Весьма популярной системой является Nagios из-за своего мощного механизма оповещений. Так же, часто используются системы больше сконцентрированные на сборе значений различных параметров, и отслеживании этих изменений с течением времени для сбора статистики, такие как: Cacti, Zabbix, Ganglia . Причем Ganglia незаслуженно обделена вниманием Хабрасообщества. В этом топике я постараюсь исправить этот недостаток, и показать насколько это гибкий и полезный инструмент.
Читать дальше →
Total votes 4: ↑3 and ↓1+2
Views16K
Comments 5

Маленькие полезные вещи. Как сделать доступ из nagios/icinga к интерфейсу управления хоста через браузеры Google Chrome и MS IE

System administrationIT Infrastructure
Sandbox

Введение


При работе с nagios/icinga рано или поздно возникает ситуация, когда надоедает каждый раз отдельно бегать в управляющий интерфейс хоста — куда-то кликать, вбивать руками адреса и имена (логин / пароль — это святое). Оптимальнее всего было бы иметь в nagios/icinga ссылку под рукой для детального разбора источника беспокойства и устранения проблем. Гугление интернета по данной теме ничего не дало, потому что разработчики nagios и icinga до таких «мелочей» не опускаются, но проблема остаётся — удобного интерфейса для системы мониторинга по-прежнему хочется.
Читать дальше →
Total votes 1: ↑1 and ↓0+1
Views5.5K
Comments 1

Мониторинг состояния серверов HP Proliant в nagios/icinga. Плагины check_hpasm и check_ilo2_health.pl

System administrationIT InfrastructureServer Administration
Tutorial
Плагинов для систем мониторинга существует огромное количество. Можно посмотреть и найти нужное в каталогах exchange.nagios и monitoringexchange. При поисках нужного плагина проверять лучше в обоих репозиториях — несмотря на кажущуюся идентичность, их содержимое различается.

Другое дело, что качество и функционал плагинов, даже сходных между собой, сильно разнятся — есть быстро слепленные на коленке хаки, работающие в строго определенных условиях и решающих узкую задачу. После написания автор плагина не стал выбрасывать его в /dev/null, а решил поведать о нём миру. Другие плагины представляют собой добротно сделанные продукты, работающие с целыми семействами устройств и предоставляющих обширную информацию о целевых системах.

Вот о последних и хотелось бы поговорить, тем более, что за время работы с nagios/icinga обнаружилось, что русскоязычной информации по плагинам для систем мониторинга крайне мало.

Данная статья посвящена мониторингу серверов HP Proliant, и автор искренне надеется, что она поможет в работе тем, кто имеет оборудование HP, и хотел бы более полно отслеживать его параметры.

Читать дальше →
Total votes 5: ↑5 and ↓0+5
Views50K
Comments 6

Icinga в действии. Мониторинг Большого Адронного Коллайдера в ЦЕРН, Швейцария/Франция

System administrationIT InfrastructureServer Administration
Translation
ЦЕРН и Icinga

ЦЕРН — Европейский центр ядерных исследователей, а кроме того это еще и столкновения частиц с частотой 40 МГц и 11000 оборотов по коллайдеру в минуту. Большой адронный коллайдер ЦЕРН – самый большой и мощный ускоритель частиц в мире. Icinga — бесплатная система мониторинга масштаба предприятия с открытым исходным кодом. Со своей стороны Icinga помогает устойчивой работе оборудования БАК на трёх из четырех детекторных площадок. Это оборудование ищет различия между материей и антиматерией, а также дальнейшее подтверждение существования бозона Хиггса и проверяет модели современной физики, в том виде, как мы ее сегодня знаем.

Читать дальше →
Total votes 15: ↑13 and ↓2+11
Views23K
Comments 25

Nagios vs Icinga. Реальная история одной из самых «горячих» веток в свободном ПО

System administrationIT Infrastructure
Translation
От переводчика


Это перевод прошлогодней, хотя и по-прежнему актуальной статьи о конфликте имущественных прав в области свободного ПО. Это только на первый взгляд кажется оксюмороном, ведь публичный код — это не только кропотливый труд, желание принести пользу другим людям и собственное самовыражение; за ним часто стоят личные устремления и интересы, что, будучи помноженным на пробелы в законодательстве, даёт неожиданные эффекты. Конфликт не дошел до судебной стадии, хотя и был очень близок к тому. Его участники отделались тратой нервов, сил и времени. Возможно, эта история будет поучительной для всех, кто занимается свободным ПО.
Читать дальше →
Total votes 13: ↑11 and ↓2+9
Views33K
Comments 9
1