Pull to refresh

Comments 40

Я опенсурс узнаю по неумению управлять пространством :D

Возможно, софт и хороший, но я его не буду использовать, как минимум потому что бесполезные отступы между элементами занимают почти 20% пространства, как KDE какой-то)

P.S. не нужно про «это опенсурс, не нравится — допиши» ) Я это все прекрасно понимаю.

Куда писать конструктивную критику и посмотреть примеры, где отображено большое количество данных?
Может вы тогда отпишетесь от всех опенсурсных блогов и перестанете видеть потенциал для себя в опенсурсных частях ваших интересов?

Посмотрим что останется в сухом остатке
Не экстраполируйте)

Мониторинг — это когда у тебя аккуратно представлена КУЧА поступающей туда информации, сгруппирована, скореллирована, подсвечена, построена, нормирована, выделены аномалии и т.д. Оно ведь делается не ради красивых графиков для эффективных менеджеров, а для полезных ИТ-людей, которым нужно «щелк глазом в сторону монитора» и сразу понять, где чего не так)
Может вам про тиволи рассказать и про то как там место используется?
Кому нужен миллион графиков, составит мнение сам, как и те, кому нужно репорт наверх подать.
Вы же из конструктивной критики просто задали вопрос куда ее писать, не обойдя вниманием еще и кеды. Очень весомо.
Расскажите, что с тиволи?
Было бы интересно увидеть обзор этой штуки и сравнение с zabbix и nagios.
Когда нибудь уже сделают нормальную систему мониторинга, простую как мунин, но с тригерами и прочими штуками для оповещения, а то все эти заббиксы и прочие просто тихой ужас.
Сам сижу на заббиксе, раньше сидел на нагиосе платном.
А в чем ужас заббикса заключается, может просто не умеете его готовить, у меня на нем более 1000 хостов — полет нормальный и все удобно.
Более отвратительного интерфейса у мониторинга в жизни не видел.

Другая сторона крайности — Zenoss. Красиво, удобно, но очень жаден до ресурсов и community-edition — Zenoss Core — сырой очень вышел последний.
Я конечно дико извиняюсь, но нафига на его интерфейс вообще смотреть? Алярмы на почту/СМС/жабер триггеры на автоскрипты починки известных аномалий, там из интерфейса только графики иногда нужны, которые вполне удобны. Автоматическое добавление железа, работа со всеми возможными вариантами взаимодействия (SNMP, IPMI, etc). Смотреть несколько миллионов показателей со всего, что мониторится — это отдел специально обученных людей нужен, задача мониторинга не красивые рюшечки рисовать, а оповещать об аномалиях в работе, хотя похоже кому что. Zenoss — фронтенд красивее, но на бэкенде тихий ужас, укладывает базу наглухо при любой нагрузке больше десятка хостов, постоянные падения, задержки в обработке данных, потеря данных, нет уж я лучше на страшном заббиксе посижу, который просто работает.
На фронтэнде Zenoss не только красивее — он логичней.
Я не пытаюсь доказать однозначное превосходство одного над другим. Я всего лишь привёл в пример другую крайность.
И часто Вы смотрите на интерфейс мониторинга, я вот уже месяца 4 не заходил на вебморду, все что нужно приходит в оповещениях.
И сколько узлов наблюдаются, сколько показателей с них снимается? Какая нагрузка на сам сервер мониторинга, если не секрет, скрин с одной из нод своего заббикса приложил ниже.
Простите, но вы х**** померяться предлагаете? При чём тут количество объектов, нагрузка и т.п. когда идёт речь об удобстве и логичности интерфейса?
В зависимости от профиля использования интерфейс удобен разный.
Понятно, что иногда не хочется показывать кишочки, но такая грубость тоже неоправданна :)
Глняьте как ставится мунин и сколько он дает из коробки в той же cpanel, а теперь тоже самое в заббиксе.
Привыкнуть к ужасу всегда можно и он будет казаться не удобным и красивым, а привычным.
Если мониторить одну cpanel и при этом не осилить написание шаблонов, то да мунин и прочие рюшечки то что нужно, но попробуйте им мониторить хотя-бы 300-500 серверов с этими самыми WHM то мунин резко станет не таким уж удобным. Есть системы которые расчитаны на работу с «глазами», заббикс не из их числа, есть которые на работу с аномалиями. Зачем мне 500 графиков в красивой оболочке, сколько свободного места на каждом из винтов, если мне нужно одно единственное оповещение, что на конкретном сервере места менее определенного процентного объема, зачем мне 1000 датчиков загрузки ядер процов перед глазами, на которых LA в пределах нормы? Я не против других систем мониторинга, у каждой свои сильные и слабые стороны, но не умея работать с ними кричать, что они тихий ужас. Дайте задачу которую невозможно реализовать на zabbix, но можно сделать на мунин — тогда продолжим диалог.
Вот у меня в заббиксе такое количество наблюдаемых показателей (более 60% опрашиваются каждую минуту) при этом сервер вполне жив и отзывчив
Да мне все равно как там сервер жив и отзывчив, у меня тоже сервер жив и отзывчив это не преимущество, это минимальная норма требований к любой системе, а вы преподносите это как восьмое чудо света.
Я тут говорю про удобство, а не про то что заббикс не может что то сделать.
В заббиксе почти все есть и он конечно же в сто раз мощнее мунина, но вот до второй версии мониторинг каждого винта надо было ручками настраивать, сейчас автоматом стал определять все винты и это большой шаг, а почему этого не было раньше то? Сложно что ли определить винты? Ну и куча таких удобств можно допилить в него.
Все определяется и добавляется автоматически, с версии 1.6 еще, там формат конфигов в xml и сгенерировать его на лету достаточно просто для любого железа, неужели Вы правда думаете что я ручками на каждую ноду добавляю более 40000 элементов и триггеров — это не хватит жизни. Там логика работы чуток другая, надо не добавлять железо, а делать шаблоны, а потом на основании определенных показателей автоматически находить железо в сети и привязывать к нужным шаблонам. То-есть логика такая, новый сервер через чиф затягивает скрипт формирования конфига, который на основании опросов реального сервера формирует шаблон для мониторинга и добавляет его на слежение в заббикс (там и винты и сетевые все, структура разбивки разделов учитывается и прочее). Имея некоторые наработки (скрипты формирования конфигов серверов, свичей и прочего) можно прийти в сеть без мониторинга и за неделю развернуть полное слежение за всем оборудованием. Отзывчивость сервера под нагрузкой огромное преимущество и к сожалению многие «нормальные» системы ему не соответствуют и это реально чудо, если систему надо масштабировать на уровень CDN.
Ну а так на вкус и цвет, сами знаете, удобство у каждого свое.
UFO just landed and posted this here
В сети на сколько хостов? Одно выяснение структуры сети, видов железяк и что же нам надо мониторить займет пару дней. День прикручивать всякую нестандартную фигню типа датчиков влажности, дыма, движения, открытия дверей и остальных неунифицированных железяк. Мониторинг это не красивый график LA одного сервака втечение суток, а комплексная система. В ней стойки, свичи, маршрутизаторы, упс, датчики, системы охлаждения и вентиляции, сервера. Что-то мне очень слабо верится в 5 минут на мониторинг даже небольшой техплощадки, не говоря про ДЦ. Или вы про единичный сервер?
UFO just landed and posted this here
если честно у меня на системе из топика раза в 3 больше показателей собирается…
Вот это уже интересно. Как дела с загрузкой отзывчивостью? Нужен ли особый тюнинг БД для работы, на сколько быстро растет база? Требования к стораджу, нужен ли кеш на SSD. Кроме мониторинга можно ли организовать полную автоматизацию на триггерах, как пример трафик по порту и количество pps за последнюю минуту превысило на 20% максимальное значение за 10 минут, необходимо проанализировать нетфлоу именно с этого порта, выявить тип трафика, сравнить с базой, если подпадает под шаблон известной атаки — заблокировать данный тип на магистральном оборудовании, чтоб до сервера даже не дошел, если тип трафика неизвестен проанализировать соурс ip, если много разных ip с одним типом трафика — резать и скидывать лог, кого зарезало ну и т.п. насколько сложно организовать такое на продукте из топика? Насколько сложно подключаются внешние обработчики? Если будет время, напишите кратко о готовой системе ее возможностях. Собирать показатели — нагрузка небольшая, основная часть нагрузки идет на обработку триггеров. Хочется сравнения именно функционала, а не у кого кнопочка отрисована красивее.
нагрузка на проц никакая. На базу соответственно её размеру. При моих объемах она росла на гигабайт в 4 часа. Любые самые заковыристые события возможно реализовать, либо на встроенном скриптовом языке, либо с помощью любого внешнего скрипта который вызовет система мониторинга. У нетиксэмэс есть вики которая потихонечку пополняется. И также форум мультиязычный на котором можно почитать об экспериментах. Лично я очень доволен.
Я бы давно написал было бы время ((
Разработчик системы кстати не отказался бы от инвайта на хабр, спрашивал пару месяцев назад на форуме.
>При моих объемах она росла на гигабайт в 4 часа.
Росла?
А можно ли поподробнее?
Какая там СУБД? Использовался/используется что-нибудь для анализа таких объемов данных? OLAP — какой нибудь?
Количество серверов, метрик, период опроса?
База какая нравится. У меня MySQL.
Ну если принять за это jasper reports )
Количество серверов, от вашей фантазии и рук.
Лично у меня все на одном. Но кластеризация поддерживается из коробки, относительно конечно. Так-как в основном система пишется 1 человеком, то и спрос с неё соответствующий.
Это интересно, надо попробовать, у меня наполнение базы 25 гигов в сутки, пришлось делать партицирование чтоб дропать всю подробную статистику старше 3х дней, оставляя вместо минутных, 5 минутные данные за неделю и часовые за месяц. Встроенный сборщик мусора при этом ложил 16 ядер в полку, с партицированием полегчало. Мультиязычность не принципиальна, а вот если из 4х нод, я смогу выбросить две — это будет великолепно, тут заинтриговали. Я думаю, если разработчик подробно опишет про настройку своей системы с нуля для базовых задач инвайт ему будет обеспечен и от НЛО. Посмотрел доку бегло, ну очень бедненько и поверхностно. Если это она wiki.netxms.org/ то я даже как-то и не знаю, маловато примеров. Руководство бы по быстрой миграции с популярных систем. В закладки добавил, как 5 нода понадобится, попробую вместо заббикса развернуть и сравнить при одинаковой нагрузке. Единственное меня еще смущает некоторая ориентация на windows системы, надеюсь и с другими можно подружить. Еще не увидел с ходу работы с IPMI, но если Вы говорите, что есть — поверю на слово.
А партицирование не ломает логику работы zabbix с базой? Или это его встроенная фишка?
Нет, не встроенная к сожалению, но работает без нареканий, если интересно подробней по партицированию в комментариях есть даже скрипт для версии 2, который все сделает автоматом, в нем 3 ошибки, но поправить элементарно да и ручками сделать не сложно. Без партицирования, к сожалению, заббикс не держит нагрузку, во всяком случае с mysql. Заббикс требует здоровенного напильника, но это цена за гибкость.
Действительно, спасибо, давно в официальную доку не заглядывал.
Нарядно! Правда, некоторые вещи пока очень сырые и неудобные. Например, подложка карт. Нужно вручную вписывать координаты (причем на значение по-умолчанию программа ругается — неверный формат). Была бы к месту возможность выбирать между OpenStreetMap, Google и еще чем нибудь. Некоторые вещи делаются нетривиально, можно было бы сделать и попроще. Я например минут пять искал куда добавить коммутаторы, маршрутизаторы и другое активное оборудование. Пользуюсь Zabbix, пока он устраивает. Но возможно перейду на NetXMS.
Это как-то неочевидно делается, не свойствах источника данных, а в отдельной ветке с картами. Но так даже удобнее. Впрочем, у меня оно тоже все время ошибку выдавало при любой попытке выставить геолокацию, надеюсь это пофиксили.
там просто путаница с разделителями, и значения должны быть как в гмапс, тогда все будет работать.
Извините за некропост. Но чем netxms лучше observium?
У меня может быть не большая сетка в 1000 устройств, но коммутаторы, роутеры и всякие там серваки win hyperV и же с ними Debian/RHEL мониторит не плохо (хотя в резерве всегда работает zabbix). Единственное чем меня привлек observium это squidlook(хотя имхо mysar, лучше)
Sign up to leave a comment.

Articles