greedykid 8 авг 2020 в 10:44

В поиске вопросов, или как создать новый отладчик

3 мин

3.5K

Программирование*Системное программирование*Rust*

+14

Комментарии 14

NeoCode 8 авг 2020 в 11:17

Да, с отладчиками грустно, даже для C/C++. Если под Windows еще как-то выручает отладчик Visual Studio, то под Linux совсем беда — как с отладчиками, так и с IDE. Да, Qt Creator что-то может, но если редактор там еще нормальный, то отладчик — тоже некая не очень удобная надстройка над древним gdb.

greedykid 8 авг 2020 в 11:21

Для C/C++ под Линукс чуть помогает rr, который умеет «отматывать» время назад. В WinDbg Preview тоже такое недавно добавили. Но это только часть необходимых возможностей, конечно.

ramzes2 8 авг 2020 в 20:52

lldb в QtCreator также работает

MechanicZelenyy 9 авг 2020 в 01:50

Clion предоставляет вполне комфортную работу с GDB.

tea1975 8 авг 2020 в 11:26

Статья понятна, но не понятно, чего именно не хватает в современном отладчике. А то ощущение, что претензия одна — возраст Горбачева

greedykid 8 авг 2020 в 11:32

Если говорить о конкретике, то текста получилось бы еще на пару экранов. :) Основная проблема — это отсутствие поддержки языковых фич, да хотя бы даже парсеров выражений. В lldb, например, для Раста вообще используется парсер выражений от C++, что вызывает серьезные трудности. Если пытаться отлаживать менее прямолинейный код (например, async/await в Расте или код использующий thread-local переменные в C/C++), все эти проблемы начинают копиться как снежный ком, и в итоге получается, что проще вернуться к знакомым println и логам.

myxo 8 авг 2020 в 13:19

А без конкретики ничего не понятно. Я могу предположить, что у меня Си головного мозга, но, например, я не очень представляю что вы хотите получить в итоге.

greedykid 8 авг 2020 в 14:27

Если смотреть с точки зрения Си, то, пожалуй, наиболее близкий пример здесь — это BPF, виртуальная машина внутри ядра Линукса, на базе которой, например, делают инструменты трассировки bcc. Через них можете смотреть, какие системные вызовы происходят, какие файлы открываются программой, сколько памяти выделяется (и отслеживать утечки), и т.д. — все это работает похожим на gdb образом, с той разницей, что брейкпоинты ставятся и обрабатываются "автоматически" — т.е., скажем, поставили брейкпоинт на вызов malloc(), и каждый раз, когда он дергается — считаем, сколько памяти выделили и откуда. В конце эту информацию суммируем и показываем пользователю.

Только в случае BPF это все обычно происходит в контексте ядра, а не в user space — но есть и версия BPF VM для юзерспейса, которая позволяет делать похожие штуки. То, что описывается в статье — близко по смыслу и духу к такому подходу, только в более общем направлении и с возможностью не только ставить брейкпоинты, но и читать произвольные области памяти. Как пример, можете посмотреть расширение для VS Code с визуализацией данных.

Да, это все можно делать, взаимодействуя с GDB через консоль или serial API, но это только та часть, которая про работу с процессами и памятью. Вторая же часть — символизация, которая в целом уже больше актуальна для Раста и других языков, т.к. в целом lldb работает в паре с clang и такой острой проблемы с тем же парсером выражений там нет.

potan 8 авг 2020 в 19:08

print позволяет одновременно наблюдать состояния разных контестов в разные моменты времени. В отладчике сложно выяснить что нибудь типа «какие значения аргумента у этой функции вообще встречались».

chapuza 9 авг 2020 в 12:46

Это, а также то, что «точка останова» очень слабо помогает в мультипоточной высококонкурентной среде, особенно если треды зеленые, и их — легион.

Нерешенные алгоритмические задачи, в которых необходимость исследовать стек и кучу побайтово на каждом шагу, — подходят к концу. Я уже и не вспомню, когда мне приходилось обращаться к отладчику; выразительность языков программирования тоже не стоит на месте, просто и если я даже где-то ошибаюсь, простой принт вот прямо тут — выявит проблему гораздо быстрее и проще.

Тип «обычных» ошибок сильно изменился со времен Горбачева; остановка выполнения просто больше не актуальна. Что прикажете делать в отладчике, если где-то в середине громоздкой обработки данных / вычисления в тысяче потоков, — гонка, которая портит результат?

S-trace 9 авг 2020 в 13:06

В случае гонки даже простое добавление/удаление print'а повлияет на итоговый результат.

chapuza 9 авг 2020 в 15:15

В случае гонки даже простое добавление/удаление print'а повлияет на итоговый результат.

Безусловно. И что?

greedykid 9 авг 2020 в 18:58

«точка останова» очень слабо помогает в мультипоточной высококонкурентной среде, особенно если треды зеленые, и их — легион.

Именно этот сценарий с отладкой зеленых тредов меня и заставил задаться вопросами из статьи. :)

остановка выполнения просто больше не актуальна

По-моему, тут дело в том, что мы воспринимаем отладку как интерактивный процесс, хотя это не обязательно так и не всегда так. "Остановка выполнения" может занимать миллисекунды и происходить автоматически, незаметно для вас. В комментарии выше я приводил примеры с BPF, который по сути тоже является отладчиком и как раз помогает работать с такими сценариями, когда у нас миллионы событий, и среди них надо выцепить нужное и понять, что именно происходит. DTrace в FreeBSD/Solaris решает ту же проблему с помощью специального DSL, позволяющего эффективно фильтровать события, агрегировать их, и выводить нужный результат — и это гораздо удобнее тех же принтов, потому что а) программу не надо перекомпилировать, б) точки трассировки можно добавлять прямо в рантайме в любой процесс (в том числе в продакшене), со сравнительно небольшим оверхедом, в) точки трассировки можно добавлять даже в ядро.

chapuza 9 авг 2020 в 19:58

BPF, который по сути тоже является отладчиком

Или «который по сути тоже является принтом» :)

DSL, позволяющего эффективно фильтровать события, агрегировать их, и выводить нужный результат

Я совершенно не чувствую себя компетентным в вопросах именно низкоуровневой отладки со стороны отладчика (да и со стороны пользователя тоже), но мне кажется, что это решение уже ближе к тому, что называется «телеметрия». Отправить асинхронное сообщение в чужой поток, который слушает, получает, фитльтрует, агрегирует, показывает, даже как-то взаимодействует когда надо с основным процессом — задача несложная, и много где реализованная.

Когда я начинал, мутабельной была куча. И иногда даже стек. Литералли :)
Тут было архиполезно остановить мир, и тщательно изучить байты ~~и заменить условный jmp на безусловный, чтобы отучить глупый Doom проверять ключик~~.

Потом мутабельными стали только объекты на несколько уровней абстракции выше. Уже там не было большой разницы: красиво развернуть дерево свойств объекта в VS/Netbeans, или просто дампнуть с именами переменных. Ну, поправить на лету было удобнее.

Теперь мутабельность, вроде, почти везде подвергнута анафеме, и по сути «принт», «телеметрия» и «отладка» — превратились примерно в одно и то же: насколько структурированно вы можете выплюнуть объект, чтобы его потом можно было легко проанализировать, классифицировать, привязать.

Зачем бы мне захотелось добавлять трассировку в продакшене я себе представляю слабо, но если захочется — я средствами языка это сделаю на коленке за пять минут. Причем так, что версия без оверхеда вовсе будет собираться просто с другим ключиком. И оно будет проще и надежней, чем любое generic решение.

Но, как я сказал, я могу целых пластов просто не понимать, или даже не видеть.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

В поиске вопросов, или как создать новый отладчик

Комментарии 14

Публикации

Истории