AloneCoder Jul 11 2016 at 13:14

Введение в компиляторы, интерпретаторы и JIT’ы

13 min

46K

VK corporate blogWebsite development*Programming*Compilers*

Translation

+29

Comments 15

Ktulhy Jul 11 2016 at 15:13

Не деревья абстрактного синтаксиса, а абстрактное синтаксическое дерево

ajojo Jul 11 2016 at 15:39

издержки дословного перевода

tagir_valeev Jul 12 2016 at 10:18

Тогда уж не «лексинг» и не «токенизация», а «лексический разбор». Не «токены», а «лексемы». «Парсинг» — тоже жаргонизм для «синтаксического разбора», хотя он более-менее устоялся.

-2

AnutaU Jul 12 2016 at 11:43

«Дерево абстрактного синтаксиса» — более точный перевод, просто все уже привыкли к «абстрактным синтаксическим деревьям» и никуда от этого не денешься.

ajojo Jul 11 2016 at 15:31

«Но даже если мы избавимся от стадии транскомпилирования, нам никуда не деться от компилирования. Например, большие программы, написанные на С (компилируемый язык), могут компилироваться чуть ли не час. Представьте, что вы написали приложение на PHP и вам нужно ждать ещё десять минут, прежде чем увидеть, работают ли внесённые изменения.»

С перепугу, конечно, можно сделать такую программу, что будет час компилироваться. Но кто в здравом уме будет держать проект в десятки-сотни тысяч строк в одном файле? Проект будет разбит на мелкие логические куски и при минимальных усилиях, потраченных на дизайн, перекомпилирован будет только измененный кусок. А это — секунды. В крайнем случае, десятки секунд.

Я согласен считать слова про почти час риторическим приемом, но тогда было бы уместно как-то более явно это указать.

-1

vadimr Jul 12 2016 at 00:24

Если вы исправили какой-нибудь .h файл нижнего уровня в большом сишном проекте (например, включающий определения базовых типов), то перекомпилироваться будет всё и долго. Хотя это недостаток конкретно языка Си с его повсеместными иерархическими макроподстановками, а не вообще компилируемых языков.

ajojo Jul 12 2016 at 10:46

Два соображения. Насколько часто вы правите заголовочник с определениями базовых типов? И поосторожнее с кванторами всеобщности.

P.S. а что вы имеет в виду под «Си с его повсеместными иерархическими макроподстановками»? И как это связано с определениями типов?

vadimr Jul 12 2016 at 11:22

Си устроен так, что компилятор не знает ни о каких изменениях типов, а просто текстуально подставляет макровставки из заголовочных файлов по #include. Поэтому изменение заголовочного файла влечёт повторную компиляцию всех исходных модулей, в которых он используется, причём даже независимо от того, в каком именно месте он был изменён, и используется ли в этих модулях изменённое место.

Про “часто” никто не писал. В цитате, которую Вы комментируете, написано “могут”.

ajojo Jul 12 2016 at 11:55

си не знает… простите, а какой язык — знает? что вы, собственно, имеете в виду, говоря «компилятор не знает об изменении типов»?

вы путаете макроподстановки и определения типов. макроподстановки — это не си, а препроцессор. а перекомиляция всех исходных модулей из-за изменения в одном заголовчнике — это, как я выше говорил, вопрос дизайна.

если не «часто», а могут без всяких численных оценок, то это довольно бессмысленное утверждение. если я один раз на 1000 перекомпиляций буду вынужден ждать десять минут вместо десяти секунд это не затормозит процесс разработки сколько-нибудь заметно.

-1

vadimr Jul 12 2016 at 12:08

Препроцессор является частью языка Си. А в языке Си нет другого способа экспортировать определение типа в другой модуль, кроме как включить в него текст этого определения через препроцессор.

В языках, реализующих управление модулями (Ада, Модула, Delphi) эта проблема перекомпиляции носит более ограниченный характер, так как перекомпилируются только модули, непосредственно включающие изменённый модуль или включающие зависящие от него интерфейсы. А в языках с динамической типизацией, вроде Smalltalk, вообще изменение типа используемого объекта – не повод что-либо перекомпилировать, кроме его собственной реализации.

ajojo Jul 11 2016 at 15:39

Кстати, JIT в некоторых случаях может быть быстрее, чем компилированный в native вариант. Это случай, когда компилятор еще не знает про целевую архитектуру (и, соотвественно, генерирует подоптимальный код), а JIT уже знает и поэтому может — теоретически — сгенерировать код оптимальный для целевой архитектуры.

tagir_valeev Jul 12 2016 at 10:23

Не только поэтому. Хороший JIT предварительно собирает профиль выполнения и оптимизирует горячие пути. Например, вы делаете виртуальный вызов, но профилирование показало, что у вас всегда в данном месте был объект одного и того же типа. Тогда вы можете выборку по таблице виртуальных методов заменить на проверку типа и статический вызов, что будет гораздо быстрее, плюс статический вызов можно будет синлайнить. Обычный компилятор можно тоже запустить в режиме профилирования, но это надо специально заморачиваться и профиль всё равно всегда одинаковый будет, а для JIT профиль зависит от способа использования программы и могут включиться разные оптимизации, если вы используете программу по-разному.

ajojo Jul 12 2016 at 10:41

Я в курсе. Но это с другой стороны взгляд, если хотите. Для того, чтобы получить выигрыш от знания целевой архитектуры по сравнению с компилятором JIT'y необязательно быть умным — достаточно знать целевую архитектуру.

Впрочем, в реальной жизни выигрыш (если он возникает) будет более вероятно за счет умной профилировки по данным. Надо бы JVM'щиков спросить…

alekssamos Jul 11 2016 at 17:22

Интересная статья. Всё наглядно и подробно объясняется. Мне понравилось. Спасибо.

knoppik Jul 12 2016 at 09:58

Спасибо за статью, очень хорошо изложили тему.
Закрыл для себя кусок знаний, о котором давно хотел почитать.