AloneCoder 25 ноя 2019 в 15:28

Как работает оптимизирующий компилятор

23 мин

19K

Блог компании VKВысокая производительность*Ненормальное программирование*Совершенный код*Компиляторы*

Перевод

+72

Комментарии 14

ice2heart 25 ноя 2019 в 15:31

Не надо быть умнее компилятора. Красивый и понятный код легче поддерживать, а компилятор и сам неплохо выкинет лишнее.
Я некоторое время назад написал транспиллер из bf в llvm ir… И было очень интересно смотреть как компилятор выкидывал куски кода заменяя на константы…

ZaMaZaN4iK 25 ноя 2019 в 15:52

К сожалению, компиляторы не идеальны и иногда таки приходится либо объяснять, что же я хочу тут получить (с помощью атрибутов, интринсиков и так далее). Ну или на худой конец просто садимся писать на ассемблере, если некогда ждать, когда там в компиляторе пофиксят очередное правило для оптимизации.

ice2heart 25 ноя 2019 в 16:02

Ага, не спорю никто не идеален, но так надо делать только после профайлинга и понимания проблемы.

domix32 25 ноя 2019 в 18:53

Кому-то же надо писать оптимизирующие компиляторы

khim 25 ноя 2019 в 20:39

Красивый и понятный код легче поддерживать, а компилятор и сам неплохо выкинет лишнее.

Главное — компилятор ничего не может сделать с вашими структорами данных. Код — да, компилятор уже часто генерирует очень неплохой. А вот понять, что вы тут вычисляете структору в 100 мегабайт только чтобы где-то в другом месте спросить сколько там в ней элементов… он может только в простейших, сильно искусственных случаях.

ice2heart 25 ноя 2019 в 20:45

Ну если таблица используется как просто хранилище данных и не изменяется то компилятор может вытаскивать данные просто по смещению. Но в целом да. Максимум что может так оптимизировать обращение к структуре, тут вы правы.

khim 26 ноя 2019 в 14:55

Сейчас как раз появляются первые попытки что-то такое сделать. Робкие и малополезные.

Может лет через 20 — это всё будет и не нужно. Но пока — о структурах данных приходится думать программисту

amarao 25 ноя 2019 в 16:07

Программа — это описание закономерностей между входными сайд-эффектами и выходными. Если они не нарушаются, то компилятор может делать что угодно (хоть заменить весь код на GLUT).

… А ещё компилятору разрешено нарушать временные сайд-эффекты, но запрещено нарушать causality.

gearbox 25 ноя 2019 в 16:39

>Теперь мы знаем, что logger — это PrintLogger
Как? type propagation или type inference? Если inference — то какой? Hindley-Milner или есть что поинтереснее?

>а multiplied — нет: она начинается с 0 и каждый раз умножается через multiplied = multiplied * count,

Ээээ, нееет. В смысле да, но как мы об этом узнали? Точнее не мы а компилятор. Что стоит за этим выводом — гвоздями прибитый эмпиризм или он на этой же логике выведет str += '' и int += 0?

ну и так далее и тому подобное. /зануда моде офф

Quetzal 25 ноя 2019 в 19:11

В Java, как и в Scala (автор статьи, Li Haoyi, хорошо известен Scala сообществу) не может быть использован алгоритм Hindley–Milner, так как HM не поддерживает sub-typing.

gearbox 26 ноя 2019 в 12:56

yep. Пропустил плашку перевода.

voidnugget 25 ноя 2019 в 20:27

В статье про Optimization Pass'ы ни слова про SSA / mSSA / Array-SSA, зато куча байт-кода…
Слишком глубоко копнули без разъяснения теоретических основ, общих оптимизационных задач и практик.

tmaxx 25 ноя 2019 в 22:36

Кое-что компилятор не смог оптимизировать (например, неиспользуемый вызов new PrintLogger)

Есть предположение, что компилятор вынужден был оставить не вызов пустого конструктора, а загрузку класса PrintLogger.

Кстати, что именно вы декомпилировали? Байт-код (результат javac) или результат JIT?

arTk_ev 26 ноя 2019 в 14:29

Все равно, на лапше-коде этот компилятор помрет на первом же этапе, да и бессмысленно.
А вот solid код, с минимум побочных эффектов, — это довольно безопасно, масштабируемо, и эффективно. Тот же Burst Compiler — чудесное решение, хоть и сырое.

-2

Зарегистрируйтесь на Хабре, чтобы оставить комментарий