noxx 28 мая 2012 в 19:42

Риалтайм дашборд

7 мин

5.6K

Perl*

+36

Комментарии 41

unity_ultra_hardcore 28 мая 2012 в 19:48

А что за странный язык? Есть археологи в посте?

-21

mephist 28 мая 2012 в 19:58

да вы остряк, как я погляжу

+15

Eternalko 28 мая 2012 в 23:22

Перлы выдает :)

vovochka404 29 мая 2012 в 07:20

И у этого человека в профиле «о себе: ДУХ СТАРОЙ ШКОЛЫ ЖИВЕТ В НАС » :-D

noxx 28 мая 2012 в 19:50

Серверная часть на Perl

Dreadatour 28 мая 2012 в 19:52

Не поддавайся на трололо

jackz 28 мая 2012 в 20:16

А красивенько получилось. Докрутить бы еще плавный сдвиг графиков с прорисовочкой линий, чтобы не так дергано было — вот это красотень была бы :)

vibornoff 28 мая 2012 в 20:24

Топик добра…

-2

bondbig 28 мая 2012 в 20:40

Красиво, но вот только при достаточно серьезной нагрузке (количестве логов в секунду) все это дело довольно быстро скукожится.

noxx 28 мая 2012 в 20:58

На данный момент 106 серверов и кушаем не более 30% cpu

noxx 28 мая 2012 в 20:58

ну и плюс вы можете поставить несколько серверов которые будут обрабатывать логи

bondbig 28 мая 2012 в 21:00

так вопрос в том — сколько логов в секунду сможет обработать один сервер.

noxx 28 мая 2012 в 21:06

на данный момент нагрузка примерно 2000 логов в секунду (106 серверов) 30% cpu в конфиге 15 толстых регулярок

bondbig 28 мая 2012 в 21:22

Т.е. в среднем 20 записей в секунду генерит один сервер. Не так и много. Промышленные решения собирают до 100 000 записей в секунду на одно устройство.
Но для homebrew вполне хорошо.

noxx 28 мая 2012 в 21:31

Буду еще оптимизировать =)

bondbig 28 мая 2012 в 21:32

пожелаю успехов! Может вырастет в продукт промышленный.

valodka 28 мая 2012 в 21:35

Если 100 тыс. записей об ошибках в секунду, то это как-то совсем плохо, наверное

bondbig 28 мая 2012 в 21:38

почему об ошибках? Любых записей. Я речь веду про системы лог-менеджмента. Которые собирают любые логи в любых форматах с любых устройств. И приводят их к общему виду.

slang 28 мая 2012 в 22:00

Есть реализация от facebook под названием scribe. Поможет легко, быстро, масштабируемо и отказоустойчиво собрать логи на Вашем статс-сервере с имеющихся нод. А сам парсер круто бы переписать на чём-то быстром, типа C — решение будет очень неплохим. Используем подобное в продакшне, отказались от регулярок и сравниваем строки, даже кривой первый ПХПшный парсер делает 3500/сек строк при удачном подборе размера файлов скрайба. На С всё гораздо быстрее, а передачей логов с нод скрайбом вообще можно пренебречь.

bondbig 28 мая 2012 в 22:05

оно только собирает? Или же парсит тоже? Самое сложное как раз распарсить логи от разнородного ПО и железа, привести к общему формату, чтобы потом анализировать можно было. Ну, для примера, на одном МСЭ блокирующее действие оставляет запись DROP, на другом — DISCARD, на третьем DENY. И все это еще в разных форматах и по разным каналам (syslog, opsec, nfs, eventlog, etc.) А на лог-сервере все должно быть в общем виде, если мы строим график по заблокированным соединениям, например, то строить надо независимо от того, что именно было написано в логе и как мы его (лог) получили.

slang 28 мая 2012 в 22:11

Не парсит оно, это отличный прозрачный транспорт, не более того. К тому же есть апи на куче языков для его использования, Вам же нужно придумать свой этот единый формат, и выбрать метод обработки:
1. Обрабатывать на ноде, с учётом специфики, приводя к единой схеме и слать в скрайб, на статс сервере же колбасить этот единый формат и отдавать в следующий слой, например построение графика.
2. Сыпать как есть в скрайб, и решать на стаст-сервере вопросы различного парсинга, форматирования и дальнейшей аггрегации/показа.

bondbig 28 мая 2012 в 22:13

ну, тогда скорости не интересны, просто транспорт упрется банально в сеть или диски.
Я же говорил про все вышесказанное, когда сказал про 100 000 в секунду, а не тупо передать.

slang 28 мая 2012 в 22:29

Любой транспорт упрётся в сеть, речь ведь не об этом. Я предложил скрайб как хорошую систему передачи данных. Понятное дело, что реализацию обработки конкретных исключительных ситуаций Вам придётся делать самому, Вы не найдёте готовой системы, покрывающей все форматы устройств. Опять же, скрайб однозначно отвечает на вопросы, насколько легко добавить/убрать ноды, сменить ранг или приоритезацию. А также, что произойдёт если нода станет генерировать слишком много логов, успеет это всё отротейтиться? А не потеряете ли Вы важные данные в случае обрыва связи с одной из нод? А при падении статс-сервера? Что делать в исключительных ситуациях, куда бежать? В скрайбе это всё решено и конфигурируемо. Парсинг же — задача конкретного исполнения (не совсем общая задача), и Вам его нужно организовывать, желательно, отдельным слоем, желательно на чём-то быстром.

bondbig 28 мая 2012 в 22:33

Меня не интересуют задачи, стоящие перед разработчиками/программистами. Я не программист. Но в деле log-management, особенно в его инкарнации в SIEM, разбираюсь очень даже неплохо (зарабатываю этим на жизнь, можно сказать), не надо мне ничего тут продавать, я сам могу продать готовые решения, которые не придется пилить с IDE и отладчиком )
И все эти «исключительные» ситуации не являются такими уж исключительными и страшными для известных мне готовых решений.

-3

slang 28 мая 2012 в 22:42

Держите нас в курсе…
А мой комментарий же относился больше к топик-стартеру (тут уж я ответом промахнулся), отражает личный опыт и может быть полезен другим читателям. Не зацикливайтесь на нём сильно, я Вам ничего не продаю.

-1

bondbig 28 мая 2012 в 22:44

К топик-стартеру надо обращаться в корне дерева, а не в глубине ветки под моим комментарием. Прости, если чем обидел, я не нарочно.

bondbig 28 мая 2012 в 20:59

какая разница, сколько серверов? Каждый может посылать 10 логов в минуту, так и 1000 можно поставить.
Сколько логов в секунду поступает — вот что интересно.

stolen 28 мая 2012 в 23:46

Чтоб избегать таких ситуаций нужно научить наш сервер обновлять конфиг на лету, что и сделано выше. Если нам пришла строчка которая начинается на 'reconfig', то, мы перегружаем конфиг. Ну и конечно же не забываем про wrapper который будет поднимать наш frenko_sender.pl во время падения.

Хочется взять и переписать на Erlang.

Но вообще очень круто. Многим симпатична идея реалтайм-отрисовки логов, но немногим приходит в голову просто взять и реализовать.

Нет ли желания еще и websockets прикрутить для большей реалтаймовости?

stolen 28 мая 2012 в 23:48

А, ну у вас же есть серьезный аргумент, затмевающий все плюшки эрланга.

Dreadatour 29 мая 2012 в 02:18

Офигеть, ты подстригся?! о_О

stolen 29 мая 2012 в 11:02

Ага. Оказалось, что в длинных волосах топор иногда запутывается. Очень неудобно выходит в таких случаях.

noxx 29 мая 2012 в 08:06

Есть, но после оптимизации серверной части =)

chemistmail 29 мая 2012 в 09:35

Интересно послушать про аргумент, даже очень.
По факту, у самого антибот на erlang работающий по аналогичной схеме, регулярки там тоже есть с вебморды добавляются, для них мозиловский js прикручен, + полный разбор по кусочкам access логов + разная логика.
Количество логов аналогичное, кушает в 1 — 3 % от cpu на виртуалке с 1 cpu и гигом оперативы.
Хост система аналогична указанной в посте.
И да, при желании можно распараллелить на кластер из нескольких машин.

seriyPS 29 мая 2012 в 01:47

Тут кстати нужно подумать над тем как оптимизировать пробег =).

У меня была похожая задача. Сделал так:
— Есть список регулярок [re1, re2, re3, re4, re5, ..., reN]
— приходит строчка лога и последовательно проверяется регулярками пока не заматчится. Например re4
— подошедшая регулярка перемещается в начало списка [re4, re1, re2, re3, re5, ..., reN]
— так что следующая строчка лога будет проверяться сперва этой регуляркой, потом остальными

Получается что редкие регулярки быстро сползают в конец а частые держатся ближе к началу. Если добавить еще какие-то веса, то можно еще улучшить характеристики.

Не сказал бы, что это сильно что-то ускорило, профайлер показал что это не самое узкое место. В итоге вместо Python запустил PyPi и получил 2x ускорение.

Единственное что — в Python хорошей структуры данных для такой работы не нашел. Хорошо подошел бы связный список…

Dreadatour 29 мая 2012 в 02:23

Можно просто посмотреть все метрики на данный момент времени и отсортировать регулярки, их определяющие, в соответствующем порядке. И пересортировывать, скажем, раз в минуту.

Ещё вариант — в начало списка помещать подстроки (регулярки) для тех выражений лога, для которых нет метрик, но которые часто встречаются в логе — чтобы их отсеять сразу и не гонять регулярки зря (есть вероятность профукать часть статистики — нужно быть осторожным).

vovochka404 29 мая 2012 в 07:33

Есть еще одно предложение по оптимизации. Никак не могу понять почему его никто не упомянул.
НЕ комилировать регулярки при каждом сравнении, а компилировать их лишь при чтении с конфига:

# $$re{$key}{re}=$regexp;  - было.
$$re{$key}{re}=qr($regexp); # стало.

perldoc.perl.org/perlop.html#Regexp-Quote-Like-Operators

noxx 29 мая 2012 в 08:08

Приду на работу попробую и отпишусь. Еще кстати есть такая штука как study()

DurRandir 29 мая 2012 в 18:45

«study» is now a no-op, presumably fixing all outstanding bugs related to study causing regex matches to behave incorrectly! © perl5160delta

noxx 29 мая 2012 в 11:13

Спасибо, сделал, пару процентов снизил.

stalker_by 29 мая 2012 в 17:13

Не в качестве критики, но очень советую посмотреть на Splunk, real-time анализ практически любых логов с графиками, дашбордами, отчетами и п.р.

Bteam 30 мая 2012 в 13:55

Не знаю что тут происходит но вот хорошая штука для отображение данных основанных на времени square.github.com/cubism/
Там даже две версии серверной части поддерживается.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Риалтайм дашборд

Комментарии 41

Публикации

Истории