ivshinslava 27 июл 2022 в 03:35

Выбираем лучший текстовый редактор для поиска логов

4 мин

14K

DevOps*Софт

Комментарии 82

neco 27 июл 2022 в 05:01

а почему нету FARа в сравнении?

+11

saboteur_kiev 27 июл 2022 в 05:02

Мало того, что нет FAR, так еще и такой подход как поиск в логах, вместо фильтрации и просмотра уже результата поиска.

ivshinslava 27 июл 2022 в 05:35

Тут видимо у меня сложности перевода. Изначально конечно хочется отфильтровать лог, и потом уже с результатми работать. Именно этот сценария я и рассматривал. Добавлю этот момент в статью.

В Notepad++ эта функция называется "Find all in current document".

saboteur_kiev 28 июл 2022 в 04:36

Тут прикол в том, что сперва notepad++ откроет документ, а принцип работы РЕДАКТОРА с плейн текстом в основном в том, что он все грузит в память, а потом фильтрует.
Если же фильтровать предварительно каким-нить grep, который читает файл построчно, не аллоцирует гигабайты памяти, то в редактор попадет уже маленький кусочек.

Ну то есть это реально принципиальное различие, кто и когда фильтрует данные. Нужно ли их фиьтровать повторно, как часто. От этого и зависит инструмент.
Можно grep blabla | less, можно less и там +F.

ivshinslava 27 июл 2022 в 05:32

FAR именно для поиска я не использовал. Открывает он большие файлы и правда быстро. Он умеет выводить все совпадения для искомой строки? Я файл открыл и он только по порядку результаты показывает.

Если использовать Find file, то он только название файла выдает, где строка найдена (нет кол-ва)

Geckelberryfinn 27 июл 2022 в 08:50

Для подсчёта можно заменить все вхождения, если мне память не изменяет, то он сообщит, сколько он замен сделал. А потом не сохранять.

Неоспоримым достоинством FAR является то, что он может открыть файлы достаточно большие, чтоб Notepad++ сообщил "File too big to open". Попробуйте на 40Гб файле, например.

freeExec 27 июл 2022 в 14:32

Потому что он их не открывает в привычном смысле для редакторов текста. Он их просматривает, и по сути памяти требует только чтобы хватало на текст что на экране.

НЛО прилетело и опубликовало эту надпись здесь

freeExec 27 июл 2022 в 15:24

Кто чего не может, не понял?
В Фар две кнопки — F3 и F4. Чтобы найти все строки достаточно использовать просмотр по F3.

НЛО прилетело и опубликовало эту надпись здесь

ivshinslava 28 июл 2022 в 09:11

Да, вижу "Find All". Но эта фича доступна только когда открываю файл через F4 (на редактирование). Если открывать через F3 (на чтение), то поиск работает, но находит только первое совпадение

smind 27 июл 2022 в 09:59

Плагин для поиска и замены в текстовом редакторе FAR. Заменяет стандартные функции Поиск и замена рядом повышенной способности: * Настраиваемые режимы выделений и выделений * Выделение всех найденных вхождений * Быстрый поиск выявленных слов * Циклический поиск/замена * Выявление всех найденных вденподобных в едином списке * Подсчет количества вхождений

Обсуждение:

http://forum.farmanager.com/viewtopic.php?f=5&t=5098

saboteur_kiev 28 июл 2022 в 04:37

в фаре это можно вот так:
edit:<<grep "mystring" file.txt

Taraflex 27 июл 2022 в 05:17

Среди «блокнотов» для просмотра логов из живых альтернатив лучшее что находил
github.com/variar/klogg

crawlingroof 27 июл 2022 в 07:40

я такой пользуюсь, посмотрю на вашу, спасибо
https://github.com/zarunbal/LogExpert/

gimntut 28 июл 2022 в 15:43

Добавлю. В klogg есть крутейшая фича, которой я не видел в других программах, разве что в шедеврах от sysinternals.
К примеру можно найти все строки в которых есть "Error", но нет "Super Error"
https://klogg.filimonov.dev/docs/news/boolean_combination/

orekh 27 июл 2022 в 05:23

Разработка Atom будет прекращена 15 декабря.

ivshinslava 27 июл 2022 в 05:53

А вот это грустная новость. Мне нравилось его для заметок использовать. Правдка с тех пор, как иногда работаю за ноутом с 16 Гб оперативы, стараюсь все эти программы вроде Atom, Teams, Outlook и Zoom не открывать =)

Semigradsky 27 июл 2022 в 10:48

Вместо Atomа бы Visual Studio Code протестировать. По ощущениям - куда быстрее Atomа.

QuAzI 28 июл 2022 в 11:22

Для заметок лучше какой-нибудь Obsidian, QOwnNotes... Atom на фоне тех же VSCode, vim, notepad++ - бессмыссленный и мёртвый проект.

Да и статья какая-то странная изначально. Большой лог-файл? grep, vim, F3 в любимом FM.

Но вообще-то лог обычно далеко не один, плюс хочется выкусить что-то в моменте и тогда ~~чиппендейл~~ grep, lnav, multitail, для куба stern во всю, если не прикручен какой-нибудь ELK/NewRelik... никогда даже не задумывался о таком изврате, как использование Atom для сколь-нибудь продуктивной работы вообще и тем более для разгребания больших логов

TyVik 27 июл 2022 в 06:14

А где Sublime text и какой-нибудь vim?

+14

ProgMiner 27 июл 2022 в 10:26

Как это "какой-нибудь vim"? Передовой инструмент для работы с большими объёмами текста! Особенно, если смотреть на потребление памяти и скорость работы при огромном наборе функций.

isden 27 июл 2022 в 11:05

vim

На самом деле не очень. Ему становится очень грустно от текстового файла на пару сотен мегабайт.

iuabtw 27 июл 2022 в 12:07

Вы шутите?
Я вимом открывал xml на 30+Гб на машине с 2Гб ОЗУ. На паре сотен мегабайт даже лагов не видно

isden 27 июл 2022 в 12:22

Не шучу. Лично это видел.
И на линуксах и на макоси.
Вы случаем не путаете vim и vi?

TyVik 27 июл 2022 в 13:01

Под "какой-нибудь" я имел ввиду vi, vim, neovim, gvim и т.п.

vi, кстати, лучше всех справляется с просмотром логов (на мой взгляд).

isden 27 июл 2022 в 11:06

Еще можно добавить vs code. Говорят он в последних версиях стал очень неплох в плане скорости работы с большими файлами.

artalar 27 июл 2022 в 12:22

vscode хорошо ищет, но плохо открывает большие (десятки тысяч строк) файлы. Если файлов очень много и они не огромные - может подойти.

Kekmefek 27 июл 2022 в 06:29

Рекомендую попробовать так же Geany и neovim/vim.

Geany является весьма не плохой заменой Notepad++ на Linux, хотя для винды так же еть сборки. Поддерживает плагины. Все написано на C++.

Aquahawk 27 июл 2022 в 06:53

Советую автору изучить тему утилит командной строки из юникс систем, благо на винду они все ставятся сейчас без проблем https://habr.com/ru/post/267697/

ivshinslava 27 июл 2022 в 07:15

Спасибо! Правда, тогда нужно уже будет сравнивать не текстовые редакторы, а разные наборы команд, видимо.

mumische 27 июл 2022 в 08:13

Зачем, если есть Powershell?

-1

Aquahawk 27 июл 2022 в 08:20

затем что powershell есть только на windows. Ну и мне лень приводить примеры где powershell аналоги древних никсовых тулов будут драматически медленнее чем оригиналы.

mumische 27 июл 2022 в 08:26

Здрасьте, приехали.
https://docs.microsoft.com/en-us/powershell/scripting/install/installing-powershell-on-linux?view=powershell-7.2

Приведите лучше пример, как вы события в evt/evtx на удалённой машине древними юниксовыми утилитами грепаете.

kale 27 июл 2022 в 09:21

Статья о текстовых файлах, evt/evtx таковыми не являются

AlexGorky 27 июл 2022 в 09:27

Я анализировал 2..3 Гб логи (это за 1 час работы). Скрипт на Powershell при поиске regexp-строки в текстовых логах nginx показал худшие результаты, чем скрипт на wshell.vbscript.

mumische 27 июл 2022 в 09:35

Как уже заметили выше, статья исключительно про скорость грепанья в текстовых файлах. Соглашусь, что упоминание powershell в данном контексте не вполне уместно. Про всякие там логстэши и прочие лог аналитиксы даже заикаться не следует.

Qbic86 27 июл 2022 в 08:06

LTFViewr - еще один хороший просмотрщик для огромных файлов логов

weirded 27 июл 2022 в 08:41

del

weirded 27 июл 2022 в 08:41

Было бы любопытно дополнить бенчмарки для грепа.
Воспользуйтесь для замеров утилитой time (которую надо отдельно доустановить, не ту, которая built-in в shell).

/usr/bin/time grep "hi" java_error_in_PYCHARM_3828.log
0.00user 0.00system 0:00.00elapsed 100%CPU (0avgtext+0avgdata 2784maxresident)k 0inputs+0outputs (0major+113minor)pagefaults 0swaps

2784k - потребление памяти, как правильно интерпретировать все эти циферки с временем я ещё сам не разобрался.

ivshinslava 27 июл 2022 в 09:15

Я уже наметил несколько утилит, которые тут упоминали. С грепом тоже попробую. Только момент по поводу результатов вызова grep - результаты поиска всё же далеки от того, что Notepad++ показывает в отфильтрованных (после запуска Find all in open document)

Sild 27 июл 2022 в 12:13

А чего там разбираться?
real - реально потраченное время (почему-то оно у вас откушен этот префикс). Wall-clock, как пишут в гайдах.
user - время в user-space (вам не надо)
sys - время в ядре (вам не надо)

Всякие нюансы типа "user и sys считает процессорное время и в случае многопоточных приложений может превышать real" - в данном случае тоже не важно

miksoft 27 июл 2022 в 09:14

В таких обзорах зачастую не хватает ещё одного фактора - способности открыть большой файл (хотя бы 4-8 ГБ) и, как подвариант, открыть файл размером более оперативной памяти.

Вот Notepad++ такое не умеет. Приходится пользоваться FAR-ом, хотя в целом он менее удобен для меня.

vconst 27 июл 2022 в 10:50

Открыть файл больше размера оперативки? Любопытно, кстати

Файлы в несколько гигов мне больше всего понравилась открывать www.emeditor.com
Очень быстро с ними работает и хорошо ищет текст в них, включая rx

vconst 27 июл 2022 в 11:35

20 гиговый (при 16 набортной) — открывал минут 10. Но память засрана игрушками и тп висящими в фоне. Но с файлами по 1-5 гигов — просто летает

AlexGorky 27 июл 2022 в 09:30

Не проводил детального сравнения, но использую hippoedit. Он достаточно шустро большие файлы открывает и умеет искать regexp по каталогам.

cahbe 27 июл 2022 в 09:30

А кто может подсказать программы действительно для чтения\анализа логов? Очень круто искать по 150 метровому логу строку, но если "вдрук" ты не знаешь что искать, и искать нужно нестандартности, было бы приятнее делать это в программах которые могут на это как-то указать, а не 600к строк глазами бежать в надежде уловить какие-то ужасы.

Может бывают какие-то программы которые сразу подсветят все "эрор" или "акес дынайд", повторяющиеся строки, или которым можно задать направленность лога (почта, веб иис\апач\джинскс,) и они в удобном виде выведут все "шероховатости"?

Понимаю что трусеньёры всё делают грепом, а что бы не ловить разночтений прямо в двоичном коде всё считывают, но вдруг есть те кому приятнее в графическом окружении работать.

ivshinslava 27 июл 2022 в 09:48

В Notepad++ можно сделать свою подсветку (Language -> User defined language).

С другой стороны, когда уже с логом работаешь, очень удобно подсвечивать нужный текст: текст выделяется, пкм->Style token. После этого строка (слово), кот было выделено будет подсвечено во всём документе.

Inine 27 июл 2022 в 11:29

Я так пробовал, но такая подсветка адово тормозит на больших файлах. Я правда на виртуалках проверял, а не на серьезном железе.

DikSoft 27 июл 2022 в 10:06

Может бывают какие-то программы которые сразу подсветят все "эрор" или "акес дынайд",

CMTrace.exe из поставки Microsoft SCCM попробуйте.

DikSoft 27 июл 2022 в 10:14

Или если нравится что-то посвежее, то теперь там же есть CMPowerLogViewer.exe ( One Trace ) ставится из ConfigMgrSupportCenter.MSI

UnclShura 27 июл 2022 в 10:13

Вообще говоря автор занался откровенно не тем. Вот смотрите: логи большие, по-этому открывать их именно в редакторах - это использовать редактор не по назначению. От этого и проблемы типа "файл слишком большой" и "долго открывается". Для просмотра надо пользоваться (неожиданно!) просмотрщиком. Он не грузит файл в память и открывает все мгновенно. Однако лог - информация структурированая. И использовать просто просмотрщик - это терять структуру. Просмотр части лога - это занятие от безисходности, когда нормальные инструменты помочь не могут.

Какие нормальные? Это конечно-же индексаторы логов - Splunk, ElasticSearch и что там еще появилось. В Splunk можно писать довольно сложные запросы, которые сделают всю работу за вас - нечего глаза на логах ломать. Это вам не grep! Это нормальный язык работы с именно логами. Если Splunk'у помочь и немного разметить сообщения (я не люблю логи в Json - я все еще иногда их глазами читаю), то он может выделять значения, агрегировать, строить условия. И на худой конец можно посмотреть кусок сырого лога выше/ниже выбранной строки. А еще он агрегирует логи со многих машин и можно следить за распределенными транзакциями.

Читать логи редактором? Фу!

НЛО прилетело и опубликовало эту надпись здесь

UnclShura 27 июл 2022 в 10:48

Ну не знаю. У меня нескольго гигабайт ротируемых логов с примерно 20 хостов и по 7-8 сервисов на каждом. Что тут ПКМ->Открыть?

НЛО прилетело и опубликовало эту надпись здесь

Sergey1124 27 июл 2022 в 11:02

Splunk и ElasticSearch - это, конечно, хорошо, но индексаторы логов помогут только если они установлены на сервере. Бывают ситуациии когда логи приходят в виде файлов, тогда нужны просмотрщики логов, а не индексаторы.

isden 27 июл 2022 в 11:11

Можно попробовать загнать логи в базу sqlite, и уже там делать извращенные выборки.

UnclShura 27 июл 2022 в 12:38

Ну так просмотрщики, не редакторы-же. Автор рассматривает редакторы общего назначения, что на мой взляд не верно. Если лог такой маленький что лезет в редактор, так и смотрите его FAR'ом или абсолютно любым другим редактором. А то начинается "долго стартует", "не может загрузить" и т.д. :)

ivshinslava 27 июл 2022 в 12:50

Спасибо, что переживаете, чем я занимаюсь =) Ваш подход конечно на голову серьёзней, но в моей работе есть несколько моментов, когда приходится логи крутить руками. Вот в такие моменты мне интерфейс и удобство работы кажутся важными моментами.

Да, Киабана тоже есть, но не все логи там доступны, к сожалению.

Sergey1124 27 июл 2022 в 10:57

Может бывают какие-то программы которые сразу подсветят все "эрор" или "акес дынайд",

Могу порекомендовать https://github.com/sevdokimov/log-viewer , может фильтровать записи по Severity, кликаете "Error" и видите только записи с severity=error. Так же можно скрыть неинтересные записи, если они зафлудили лог. Выделяете текст на не нужной записи и нажимаете "Скрыть записи с таким текстом".

Chloroform 27 июл 2022 в 09:43

Я использую glogg. Мне вполне нравится. Жаль не увидел в списке сравнения

AelDeyr 27 июл 2022 в 09:57

+1, glogg легко переваривает 100 гигабайтные логи

Taraflex 27 июл 2022 в 13:32

glogg мертв.
Есть живой форк с плюшками github.com/variar/klogg

zooks 27 июл 2022 в 09:50

Софт в тесте, мягко говоря, не самый актуальный. Когда тестировал редакторы на открытие 600 МБ файла, хорошо себя показали Sublime Text и неожиданно VS Code, а Atom завис.
Куда удобнее под Windows запустить WSL и использовать нормальный человеческий терминал.

smind 27 июл 2022 в 09:50

ну и где FAR?

xnike 27 июл 2022 в 09:52

FSA 27 июл 2022 в 09:56

Когда посмотрел на заголовок, почему-то сразу вспомнился journald. Можно получить интересующий фагмент логов, а потом уже оп нему сделать нужный grep, если нужно. Если нет тонны текстовых файлов, то и поиск становится проще. К тому же и место на диске экономится и подробнее информация о событиях сохраняется.

weirded 11 сен 2022 в 14:59

Там ещё и встроенный grep (journalctl -S) есть, чтобы по пайпу зазря гигабайты логов не гонять.

condemil 27 июл 2022 в 09:57

Ещё есть https://github.com/BurntSushi/ripgrep

NAI 27 июл 2022 в 10:03

Изначально я пытался использовать меню “Открыть с помощью” из проводника, так как чаще всего логи открываю именно так.

??? Самое частое это дабл-клик по файлу или перетаскивание в окно. И тут время открытия файла выходит на первое место.

Ну а вообще, зачем открывать лог на овердофига строк, потом его парсить, если можно сразу парсить (да еще и пачку файлов)?

wsl > grep -r "Jul 25 04:" .../log/ > full_log.txt

и вуаля мы имеем файл со всем что происходило в 4 утра 25 июля.

Да, это будет работать если 1 запись - 1 строка. Для всего остального надо добавлять или -А или -B.

weirded 11 сен 2022 в 15:01

При динамической длине недатированных многострочных хвостов логов игры с угадыванием размера контекста и кусками ненужных контекстов довольно болезненными становятся.

NAI 11 сен 2022 в 16:57

Как на счет использовать при парсинге регулярки? Греп в них умеет.

НЛО прилетело и опубликовало эту надпись здесь

AlexeevEugene 27 июл 2022 в 10:09

Кстати у MS есть классная штука для просмотра логов - CMTrace. Это часть system center 2012 r2 configuration manager toolkit. Это маленький exeшничек, который сильно упрощает просмотр живого потока событий.

Sergey1124 27 июл 2022 в 10:52

Не могу не заметить что есть специализированные программы именно для просмотра логов, например вот: https://github.com/sevdokimov/log-viewer. Она может мгновенно открывать файл любого размера, не тратя много памяти, потому что читает только ту часть лога, которая отображается в данный момент. Определяет формат лога и подсвечивает некоторые поля, чтобы было удобнее читать. Так же позволяет открыть несколько логов в одном view, записи будут смёржены по таймстемпу.

entze 27 июл 2022 в 11:00

Боженька, храни SoF - https://stackoverflow.com/questions/159521/text-editor-to-open-big-giant-huge-large-text-files

kostushka 27 июл 2022 в 13:25

Плюсы Notepad++ :

Может искать по регуляркам и спец. символам (\n \r \t и т.д.)
Может искать по всем открытым файлам
Может подсвечивать и помечать найденное по тексту
Может считать число найденных вхождений (очень удобно для подсчета объектов)

gdt 27 июл 2022 в 16:06

Пользуюсь Notepad++ исключительно из-за его супер-невероятного Find All, как раз для просмотра не очень больших логов (меньше 100Мб). Что-то похожее есть в Visual Studio конечно, но по ресурсам вообще несоизмеримо. Для кодинга, скриптинга может и есть редакторы гораздо интереснее, но не в этом случае.

PaulZi 28 июл 2022 в 01:10

Listener из Total Commander тоже очень неплохо выполняет открытие и поиск по большим файлам, как и в FAR он не загружает весь файл в память.

NightShad0w 28 июл 2022 в 21:32

Из быстрых текстовых редакторов под Windows раньше пользовался Bred 3.0.3 который похоже застрял в развитии, и теперь BowPad. Быстро запускается, разумно большие файлы открывает без проблем, есть подсветка вхождений строки в тексте даже без использования поля поиска.
Под MacOSX пользовался TextMate, пока не открыл для себя BBEdit. Не то чтобы инструменты специально для логов, но для быстрого и частого инспектирования текстовых и не очень файлов размера до нескольких гигабайт норм.

eugenex15 28 июл 2022 в 21:59

рекомендую обратить внимание на CudaText
после Sublime, Notepad++ и т.д. использую CudaText, nvim (spacevim), VSCode.

PS
CudaText is a cross-platform text editor, written in Object Pascal. It is open source project and can be used free of charge, even for business. It starts quite fast: ~0.3 sec with ~30 plugins, on Linux on CPU Intel Core i3 3GHz. It is extensible by Python add-ons: plugins, linters, code tree parsers, external tools. Syntax parser is feature-rich, from EControl engine.

PPS CudaText VS other editors тут про производительность.

entze 29 июл 2022 в 13:43

Более сложная задача, чем просмотр логов - просмотр XML. Тут https://xmlexplorer.github.io в помощь.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Выбираем лучший текстовый редактор для поиска логов

Комментарии 82

Публикации

Истории