TashaFridrih Apr 14 2016 at 15:35

Более чем 80 средств мониторинга системы Linux

12 min

315K

ua-hosting.company corporate blog

+70

Comments 68

gena_glot Apr 14 2016 at 16:20

Статья хорошая, надо обвести в рамочку но 80 утилит требуют классификации и какого-то быстрого поиска. Не знаю, например сделать то самое web-application с тегами, рубрикатором и функцией search.

+11

outcoldman Apr 14 2016 at 16:35

Недавно обсуждали на hackernews, если не ошибаюсь, http://netdata.firehol.org

vetash Apr 14 2016 at 19:34

Поставил, сижу блюю радугой.

ferosod Apr 15 2016 at 14:22

Я сильно извиняюсь, это значит вам понравилось или наоборот?

vetash Apr 15 2016 at 14:24

Это значит что очень понравилось, да. :)

Amet13 Apr 15 2016 at 16:55

По скриншотам красиво, а что по удаленным хостам, умеет?
По ресурсам сколько ест?

Aristes Apr 14 2016 at 17:00

NetData (https://github.com/firehol/netdata). Тоже очень занятная штукенция

CamKuran Apr 14 2016 at 17:00

Есть еще Icinga, в отличие от Nagios от которого он берет начало активнейше развивается, но поддерживает его плагины.

de1m Apr 14 2016 at 20:04

Про icinga вообще мало слышно, хотя проект на самом деле очень хороший. Может кто-то хочет попробывать, я в прошлом году сделал контейнер для второй версии с графиками, веб мордой, ad, в общем со совсем фаршем(тут)

gre Apr 15 2016 at 00:16

icinga2 — совершенно прекраснейшая вещь.
Быстрая, очень гибкая, но…
графики идут, как приблуда сверху. То есть, вы не получите аналитики, не узнаете отклонений от «обычного» поведения. Мне это не нужно(вернее, у меня нет на это ресурсов) — потому ок.
icinga2 активно разрабатывается — есть высокий риск получить падение программы в неожиданной ситуации.
Впрочем, при должном внимании — это легко решаемо, а при расследовании еще и становится понятно — «как не надо делать».
Важный минус — в веб-интерфейсе нет отчёта по SLA.
Через sql, конечно, можно всё, но кому-то будет минусом.

резюмируя: если бы сейчас я выбирал бы мониторинг — я бы несколько раз подумал в сторону более менеджероориентированных решений.
мимоходом посматриваю на influxdb/opentsdb.

С другой стороны, я не уверен, что они удержат 1500к проверок минуту на одном процессорном ядре.
Icinga скрипит, но держит.
Правда, пару недель назад я не успел оптимизировать часть проверок и потому теперь у меня 2 ядра на исингу))

foxmuldercp Apr 16 2016 at 21:08

Graphite — собирает что приходит, отображает. у себя поднял — днсы в него данные кидают
остальное можно netcat'ом засунуть.

gre Apr 16 2016 at 22:26

Да кто ж спорит-то? В icinga можно даже настроить, чтобы данные в графит отправлялись на другой хост.
Я хотел сказать, что с одной стороны — icinga — очень быстрый мониторинг — именно за счёт отсутствия лишних функций.
С другой стороны — как только эти самые «лишние» функции вам становятся нужны — вы должны их сами.
В иных решениях некоторые aggerated/manager-специфичные вещи идут из коробки.
Это то, на что я хотел обратить внимание.

foxmuldercp Apr 16 2016 at 23:24

а как настроить чтобы данные об хостах/сервисах из бд брались? я возился, так и не осилил. Мне надо дать доступ к настройке но чтобы не надо было текстовые конфиги как в нагиосе править?
и кстати, как в графит данные отправлять?

gre Apr 16 2016 at 23:47

данные в графит отправить — graphite_writer или как-то так.
По документации гуглится легко — шлёт все perf данные в графит.

настраивай по api — я лично не пробовал, но возможность такая есть.

У меня небольшая специфика — хосты часто добавляются/удаляются.
Мониторинг _пока_ вне этого процесса — просто раз в несколько часов запрашиваю список хостовз Б по api… Это даёт много боли — icinga может упасть, если на хосте стоял даунтайм, а его внезапно удалили.
В следующей версии этот баг пофиксят, а работа по API решит все проблемы сразу.

По поводу хостов/сервисов из БД — у меня такая специфика — куча хостов в digitaocean и vcale
Я написал 2 скрипта для каждого провайдера, которые берут список хостов и генерируют конфиг в /etc/icinga2/conf.d/${provider}.conf
а потом ребутают мониторинг.
Это не очень правильное решение, но для меня оно работает.

если бы я делал это сейчас с нуля — я бы тоже самое сделал через API icinga.

Про сервисы — кажется там всё просто — на основе переменных у хоста — применяем сервисы.
В общем, опиши в личку специфику — глядишь что и посоветую.

dintel Apr 14 2016 at 17:00

В «Log monitoring tools» можно еще добавить logstalgia — утилита которая визуализирует логи apache в реальном времени.

myz0ne Apr 15 2016 at 11:39

Туда же: logtop — статистика логов в реальном времени

amarao Apr 14 2016 at 17:01

А как же утилиты мониторинга whoami и pwd?

Если ifconfig — средство мониторинга, то почему whoami нет?

+10

VolCh Apr 17 2016 at 12:02

RX bytes:137148583 (137.1 MB) TX bytes:11759977 (11.7 MB) — это не для мониторинга?

amarao Apr 17 2016 at 20:09

С тем же успехом можно считать ssh средством мониторинга — он же выводит motd, а там бубунта la и uptime выводит.

JIghtuse Apr 14 2016 at 17:03

dtrace для Linux не существует.

akardapolov Apr 14 2016 at 21:18

Смотря в каком.

Using DTrace on Oracle Linux

UFO just landed and posted this here

zlyoha Apr 27 2016 at 20:15

53. /proc

welcomerooot Apr 14 2016 at 17:11

Graphite не хватает, по-моему.

Tolsty_kot Apr 15 2016 at 14:35

и Grafana к нему

foxmuldercp Apr 16 2016 at 21:10

curl'ом бы в неё научиться данные добавлять — netcat не везде есть возможность поставить.
А ещё я с формулами не могу разобраться, чтобы рисовалось относительное значение прироста, а не сам прирост в 90 градсной диаграмме

tkf Apr 14 2016 at 17:31

Странно что есть apachetop, но забыт [url=https://github.com/lebinh/ngxtop]ngxtop[/url]. Иногда помогает :)

tkf Apr 14 2016 at 17:37

невнимательность мой враг :( ngxtop

WST Apr 21 2016 at 10:24

uwsgitop туда же

fekrado Apr 14 2016 at 17:45

Для os aix существует topas встроенная утилита.

Pasha4ur Apr 14 2016 at 17:53

Есть ли для линукса утилиты разгона?

Как-то ставил для изучения Ubuntu, но столкнулся с проблемой, что процессор и видеокарта почти всегда работали на максимальных частотах. Хотя в Виндовсе я понизил частоту ГПУ с 850 до 51Мгц через MSI Afterburner. Хватает даже для фотошопа

maks1mm Apr 14 2016 at 19:37

А чем мешала работа на максимальных частотах? Максимальная частота это же не максимальная загрузка процессора.
Тем более в случае с видеокартой. У вас она точно одна или частоту снизили, а фотошоп себе использовал всторенную интеловскую и было ощущение что хватает?!

Pasha4ur Apr 14 2016 at 19:52

У меня амд проц + нвидия. Видеокарта зря грелась и шумела.

ARD8S Apr 15 2016 at 11:39

Выход: поставить дрова на дискретку и в программе управления (nvidia x server settings) регулировать профилями: power mizer — perfomance/adaptive/idle.

dolgacheff Apr 14 2016 at 18:25

Я бы NetXMS еще добавил.

gre Apr 15 2016 at 00:09

Труд хороший, но бесполезный — кому надо и так знает, а кто не знает — не поможет.
Лучше бы расписали — в каких случаях какая утилита поможет, имхо, ес-но.

mark_slepkov Apr 15 2016 at 18:15

Ну вот я например не знал ничего кроме top и htop. теперь когда мне понадобится утилита мониторинга чего — либо(а она по любому понадобится) я зайду на эту статью и выберу подходящую. Автору спасибо.

usefree Apr 15 2016 at 00:47

Есть еще такая интересная софтина http://riemann.io/ — поверх collectd

paramtamtam Apr 15 2016 at 09:01

«newrelic.com» не будет лишний в этом списке. Ставится в качестве демона, раз в N минут шлет логи на свой сервер, и рисует там красивые графики:

Screenshot

Правда на бесплатном аккаунте доступны логи лишь за 1 сутки, но зато есть возможности уведомлений если начинается оверлоад или место заканчивается. В общем — это один из фломастеров, который, возможно, будет полезен.

zcasper Apr 15 2016 at 09:15

WebMin не ахти решение, помимо того что он часто изменяет свой конфиг прибивая etckeeper, так у него ещё и свой взгляд на то как должны выглядеть конфиги других программ, что практически ограничивает их настройку за пределами последнего…

foxmuldercp Apr 16 2016 at 21:14

Перлоподелие было годным тогда, когда альтернатив не было.
Сейчас есть гораздо более красивые «управлялки» — Ajenti, например, лично пользовал, проникся.
Правда, я сейчас на рельсах пишу свою панель управления хостингом приложений кластерным, так что я из всех этих plesk/cpanel/vesta/ajenti/webmin идеи собираю в копилочку

Turilion Apr 15 2016 at 10:19

Отличная статья, о многих инструментах даже не знал)
Но так как список большой, надо бы как-то систематизировать, и полное описание со скринами можно под спойлеры чпрятать, будет вообще сказка.

OLQLOSH Apr 15 2016 at 11:40

Есть еще argus.tcp4me.com
Использую его для мониторинга доступности хостов по ping. Так же может проверять доступность портов. Простая в использовании штука с очень простым веб-интерфейсом.

chabapok Apr 15 2016 at 11:52

Точней говоря, RRDTool — кольцевая база (плюс утилиты) с периодом дискретизации 1сек и более, а Munin — система мониторинга с плагинами на базе RRDTool. Если надо мониторить что-то с периодом 100мс, то rrdtool уже не годится :(

varnav Apr 15 2016 at 12:06

sngrep забыли

ZloAlien Apr 15 2016 at 12:21

А мне нравится PRTG.

moldabekov Apr 15 2016 at 14:21

Забыли добавить сюда Sensu, который вообще может всё при наличии прямых рук и его богатый репозиторий плагинов (https://github.com/sensu-plugins) выручает почти всегда. Особенно если эту радость сдружить с Graphite и выводить всё по красоте

JuriM Apr 15 2016 at 15:59

pgtop — PostgreSQL performance monitoring tool akin to top

amgorb Apr 15 2016 at 17:42

еще есть https://prometheus.io/ http://demo.robustperception.io:9090/consoles/index.html

vadoo Apr 15 2016 at 18:14

Про traceroute написали, а про tcptraceroute нет. Хотя утилита может быть очень полезна

fallen8rwtf Apr 15 2016 at 19:19

1. Приятно было бы пользоваться список со ссылками в самом начале поста
2. По своему опыту, положил бы рядом все утилиты из пакета sysstat

DuD Apr 15 2016 at 19:20

Как сюда попал cpulimit?

-1

Hesed Apr 15 2016 at 22:54

Не пугайте людей — скриншот от OpenNMS просто ужасно древний :)
Уже давно она весьма симпатична на морду лица и всё столь же беспощадна в настройке.

Saffron Apr 16 2016 at 03:31

Люди часто недооценивают htop. У него помимо дефолтных сенсоров, есть ещё пару десятков других, которые по умолчанию он не показывает. Например, htop вполне умеет показывать использование диска, и в битах в секунду и в операциях в секунду.

Gendalph Apr 16 2016 at 22:43

И cgroups! Что в купе с контейнерами — мегаудобно.

gre Apr 16 2016 at 23:52

Ребят, а можете не полениться и написать статью — в каких случаях надо смотреть на `метрику` и что она показывает.
Просто статья говорит — существует over 80 утилит мониторинга.
Но когда их надо использовать и на что внутри смотреть — большой вопрос.

bodqhrohro Apr 17 2016 at 01:47

Спасибо, теперь можно выкинуть тормозной iotop. Пока нагрузка на диск не спадёт — не запускается, а потом толку с него? Постоянно держать — слишком до процессора охочий.

kamtec1 Apr 17 2016 at 09:48

Отличная статья :)

s0meone Apr 17 2016 at 21:18

sysdig.org
iovisor.github.io/bcc

technik Apr 18 2016 at 10:26

Список безусловно большой, вот только непонятно как это всё использовать. Свели бы всё в какую-нибудь общую таблицу по всем параметрам.

Ну и из насущного, может посоветуете что-то для анализа трафа для VDS на debian, чтобы с графикой, красиво, не сильно отягощал и без большого количества зависимостей при установке.

alexws54tk Apr 18 2016 at 10:27

Сначала хотел просить «Что за шрифт в терминале с „htop“?», но когда увидел „зоопарк“ скриншотов — передумал.

А если по делу, то забыли про замечательную утилиту „trafshow“ для мониторинга трафика по интерфейсам и нетолько, отечественная разработка вышедшая из недр Новосибирского провайдера „АО Ринет“ «RISP Telecome»

Selden Apr 19 2016 at 01:54

Кажется, вы добавилив мой «любимый» арсенал пару команд ) Спасибо

Velikodniy Apr 19 2016 at 10:41

Для мониторинга сети еще можно добавить tcptrack и slurm.

paulig Apr 19 2016 at 12:07

+ tcpblast
+ iperf

paulig Apr 19 2016 at 12:04

За incron огромное спасибо, не знал! Надеюсь, можно будет выкинуть баш-скрипт из системы, заменив его этой программой.

kamtec1 Apr 20 2016 at 00:44

apache2ctl status / apachectl show fullstatus не в списке :(

havelock Apr 20 2016 at 10:53

Я df -h обычно использую в паре с ncdu, показывает статистику использования диска файлами и папками.

По ссылке выше доступны ещё альтернативы.

Sild Apr 20 2016 at 15:21

Ещё можно посмотреть в сторону ATSD (time-series database). Представляет мощный инструмент для сбора и анализа данных, есть бесплатная версия. Можно отсылать данные с тех же nmon, vmstat и прочьих утилит.

Из плюшек — агрегация практически любого типа данных, прогнозы, масштабируемость (работает на стеке hadoop-hbase)