unconnected Dec 29 2011 at 13:13

Прагматичный подход к производительности

7 min

2.3K

Designing and refactoring *

Translation

+59

Comments 26

retran Dec 29 2011 at 13:27

Подписываюсь под каждым пунктом.

lightcaster Dec 29 2011 at 13:36

Хорошая статья. Почти со всем согласен. Вот только

>> Убедись, что функции выполняются за время O(n)

ну блин, а если сложность — квадрат, или еще хуже, кубическая? Задачи-то разные бывают. К тому же для определенных вещей и линейное время тоже может быть убийственно долго. Вобщем, не понял.

unconnected Dec 29 2011 at 13:40

Так вроде ж и написано:

Конечно же, не всегда есть возможность следовать всем рекомендациям. Например, некоторые алгоритмы реально требуют времени больше чем O(n).

Имхо, автор ведет речь о том, что если функция через-чур сложна, нужно внимательно посмотреть, а нельзя ли её сделать проще

mixailflash Dec 29 2011 at 14:16

отличная статья

-1

RollingStone Dec 29 2011 at 14:34

Очень приятная статья и перевод. Спасибо.

musuk Dec 29 2011 at 14:35

>Массивы лучше сложных структур данных

Совершенно не понял это утверждение, расшифруйте плиз.

unconnected Dec 29 2011 at 14:36

2. Не недооценивайте силу простоты

по-моему, всё очевидно

Ogra Dec 29 2011 at 14:57

Массивы лучше деревьев, связанных списков и прочего. Там где это возможно — лучше использовать их.
Например, не нужно делать binary heap на указателях, если у вас ~50 элементов и точно не больше сотни. Массив не только будет проще, но и может получить существенный выигрыш в производительности из-за линейного доступе к памяти.

Pushkoff Dec 29 2011 at 16:39

в «Эффективном использовании STL» Мейерса есть метод как заменить map на vector.
другой вериант, это если у нас в мапе бывает немного разновидностей значений, допустим 10 из 100 (примерно, хотя на практике значения бывают больше допустим 50000 из 100000), то не нужно заводить мап чтоб их хранить и пытаться экономить на этом память, можно завести массив на все 100 элементов, и пометить есть ли он в наличии. на маленьких кусках данных это часто даже выгоднее чем заводить мап, хотя бы с точки зрения количества аллокаций, особенно если есть вероятность что в наборе появятся все варианты.

допустим в играх часто не меняется набор файлов, но при этом не менее часто нужно хранить какие-то ресурсы которые из этих файлов выгружаются. одно из решений к которому придет любой школьник, это map<filename,ressource>. более красивым решением может быть нумерация всех файлов на этапе компиляции, и использование vector<ressource> и vector<filename>, во втором мы ищем id по имени (можно при желании отсортировать и использовать бинарный поиск), в первом за O(1) получаем ресурс по ID, такой способ позволяет отказаться от указателей на ресурсы, что даст более гибкие методы управления ими (время доступа по идентификатору O(1), часто идентификатор может иметь меньший размер чем указатель, хотя это уже спички).
но если посмотреть еще, то можно заметить что vector<filename> нам не очень нужен, так как обычно имена файлов получают из других файлов либо файлов конфигураций, где какой нибудь скрипт их может заменить на ID еще в компайл тайме (в смысле на стадии сборки ресурсов), что позволит выкинуть строки и мапы вообще, получив возможность более гибко менеджить ресурсы, но ценой добавления стадии сборки ресурсов и отсутствия возможности добавлять новые файлы в уже готовую игру (немного усложняет патчинг и увеличивает размер патча, нужно это или нет уже другой вопрос).

вот так вот серия небольших размышлений которая занимает считанные дни позволяет увидеть совсем другую систему ресурсов в игре, сэкономив недели в конце проекта.

oncon Dec 29 2011 at 14:39

Согласен со всеми пунктами, но хотелось бы добавить, что все хорошо в меру.
«Преждевременная оптимизация как преждевременная эякуляция, ничего хорошего!»

Pushkoff Dec 29 2011 at 16:18

очень многие неправильно понимают смысл этой фразы, и считают что оптимизировать нужно в конце то что тормозит.
не потраченный час на этапе проектирования, превращается в потраченный день перед релизом (это касается не только оптимизации).

equand Dec 29 2011 at 20:48

Согласен, когда подают продукт в котором большинство проблем могли бы быть просто написаны правильно и не были бы проблемой…

Bambr Dec 29 2011 at 19:23

Основной посыл автора в том, чтобы балансировать посередине между преждевременной оптимизацией и написанием заведомо-тормозной-лажи.

lair Dec 29 2011 at 16:52

Маленький классический пример на преждевременную оптимизацию:

Есть некая операция (например, получение всех классов в сборке, реализующих некий интерфейс). Она, конечно же, вынесена в отдельный метод (иначе это плохое проектирование), а может быть и в отдельный класс (если мы пуристы).

Очевидно, что операция небыстрая, и первое побуждение — написать там же рядом с этим методом (в этом классе) кэш для этой операции. И вот с этим побуждением и надо бороться. Не надо писать этот кэш сейчас — совершенно понятно, что мы можем написать его в любой момент позже, когда (и если!) мы поймем, что эта операция отнимает слишком много времени.

Не надо *сейчас* тратить на это пять минут (или полчаса, или полдня, если мы задумаемся о многопоточности и блокировках). Надо убедиться, что все работает, и пойти решать следующую бизнес-задачу. А это место оставить на рефакторинг.

Если *когда-нибудь* кто-нибудь вообще заметит, что оно медленное.

johnnythekid Dec 29 2011 at 17:20

По-моему автор стремится к той крайности, которая «а давайте все заранее предусмотрим и запараллелим/кешируем/что-нибудь-еще».

VolCh Dec 29 2011 at 18:56

>Массивы лучше сложных структур данных

Весьма спорно. В плане производительности они, конечно, лучше, но записи $user[0], $user[USER_ID][] (где константу надо ещё определить заранее) и даже $user['id'] читаются, имхо, сложнее, чем $user->id (в идеале user.id).

Плюс для слаботипизированных языков (в сильнотипизированных массивы, вроде как, не допускают разнородные элементы) «сложная» структура данных позволит воспользоваться анализом кода, автодополнением и прочими плюшками, т. к. будет видно (по коду или ~~аннотациям~~ комментариям), что user.id может быть только числом.

unconnected Dec 29 2011 at 19:33

Кроме PHP есть много других языков. Там где явно задан тип массива — все эти автоподстановки прекрасно работают.
Я в курсе о вашей любви предлагать не попадающие под правило примеры, но, имхо, эта статья не тот случай.

VolCh Dec 29 2011 at 19:47

Про подстановки в сильно или строготипизированных языках, о существовании которых я знаю и немало на которых писал, я сам указал в своём комменте. Но это лишь дополнение к основной мысли. Главное, что даже в случае однотипных (с технической точки зрения, но не с семантической) данных в каноническом массиве, что читабельней в случае, например, C/C++: a[0], a[RESOURCE_1] или a.resource_1, если размер массива фиксирован на этапе компиляции, а каждый его элемент несет разную семантическую нагрузку.

unconnected Dec 29 2011 at 20:06

Если вам нужно записать карту локации размерами AxB в ячейках которой расположены юниты с целочисленным идентификатором от 1 до N, массив, имхо, гораздо лучше читаем чем конструкции вида Map.Point(x,y).getUnit().
Не вижу смысла спорить, любую идею можно довести до абсурда.

TheShock Dec 29 2011 at 22:00

Вот только если мы захотим сделать дополнительную функциональность, например, на ячейку можно ещё повесить эффект. Или здание. Вот тут то и придётся строить костыли и кривости вместо простого и очевидного

map.point(x,y).getEffect();
map.point(x,y).getBuilding();

unconnected Dec 30 2011 at 07:57

А если не придется?
А придется ли?
А что за задача?
А если здания не предусмотрены в принципе?
А чем хуже, если здания имеют айдишники от N+1 до зю?

Обсуждаем, блин, сферического коня в вакууме и пытаемся найти для него «простое и очевидное» решение.

Если есть желание, можете продолжить :)

TheShock Dec 29 2011 at 21:59

Минус в комментарий вам за то, что даже не прочитав сообщение бросились критиковать и осуждать комментатора.

-1

unconnected Dec 30 2011 at 07:47

Да ради бога, можешь еще в карму поставить.

TheShock Dec 30 2011 at 09:31

Вас не понять (всех Вас, а не именно вас). Если ставят минус — начинаете ныть, что поставили минус и не сказали за что. Я поставил минус и объяснил — так понты пошли.
И да, хотел бы поставить в карму — поставил бы в карму.

-1

unconnected Dec 30 2011 at 09:57

Тогда уж «всех вас, а не именно Вас» :)

И да, есть у меня такой понт: «Не говори мне, что делать, а я не стану говорить куда тебе идти»

А про минусы-плюсы ноют те, кто еще не усвоил простую истину

DZhon Dec 30 2011 at 12:28

Рыцарь унылого хабра, не утруждайтесь, пожалуйста.