doom369 Jan 8 2013 at 14:13

Одна маленькая оптимизация

2 min

38K

Java*

+72

Comments 99

alexanderzaytsev Jan 8 2013 at 14:37

Ужс. Правда все так плохо в Java? В C# компилятор сам делает такие преобразования. И объекты итераторов там обычно структуры и хранятся в стеке.

+10

doom369 Jan 8 2013 at 14:46

На самом деле это ожидаемое поведение. Для коллекций свой for, для массивов свой. Ведь возможна ситуация когда на вызов метода iterator() возможна некая логика…

UFO just landed and posted this here

doom369 Jan 8 2013 at 15:21

Да, Вы права. Но это случается не часто. Полагаться на это не стоит.
Во-первых, escape analysis не всегда возможен в виду ограниченности стека.
Во-вторых, escape analysis может быть банально отключен.

UFO just landed and posted this here

doom369 Jan 8 2013 at 16:12

Да, включен по умолчанию. Но его можно выключить. Еще — чем больше стек вызовов, переменных в каждом из методов тем меньше памяти остается. Что сводит вероятность создания на стеке к весьма малому числу.

>>не могу понять что тут хотят сказать в последнем предложении.

Наверное опечатка, думаю имелось в виду, что объекты, которые выходят за область видимости метода не создаются на стеке.

UFO just landed and posted this here

Walrus Jan 9 2013 at 11:56

non globally escaping object — это объект который убегает из данного метода, но не убегает из цепочки вызовов (и соответственно не убегает из треда). Для такого объекта можно спокойно удалить синхронизацию (не убегает из треда). При этом убегание из метода по цепочке вызовов может быть разное: убегает только вниз по цепочке, убегает только вверх или туда и сюда. Для случая убегания только вниз можно разместить объект на стеке (для остальных так просто нельзя). Так вот, там сказано, что C2 этим не заморачивается. ;)

blaze79 Jan 10 2013 at 09:31

в джаве нету объектов на стеке

alexanderzaytsev Jan 8 2013 at 15:27

В общем случае это будет смахивать на нарушение LSP. Т.е. если есть какая-то разница между итерированием через индексатор и итератор, то вы что-то делает не так.

-2

UFO just landed and posted this here

mayorovp Jan 8 2013 at 14:56

В Java нет структур, которые можно было бы хранить в стеке…

alexanderzaytsev Jan 8 2013 at 15:22

Я знаю

doom369 Jan 8 2013 at 15:22

Вы не правы — en.wikipedia.org/wiki/Escape_analysis

mayorovp Jan 8 2013 at 15:27

Escape analysis, как и любая другая оптимизация, может не сработать из-за магических причин (слишком большой уровень вложенности кода, слишком большое число локальных переменных, и т. п.)

В C# же итератор можно сделать структурой, которая будет размещаться на стеке всегда (пока ее не приведут к интерфейсу).

doom369 Jan 8 2013 at 15:50

Да. Но согласитесь, утверждение

В Java нет структур, которые можно было бы хранить в стеке…

Не совсем правдивое.

-2

mayorovp Jan 8 2013 at 15:52

Оно правдивое.
Под структурой (struct) я понимаю тип данных, который всегда хранится к стеке.
Структур в Java нет.

Что не так?

doom369 Jan 8 2013 at 16:17

Что не так?

Так как речь о java, то Ваши «структуры» воспринимаются исключительно как объекты. А объекты могут быть созданы на стеке (не посредством языка, а виртуальной машиной).

-3

UFO just landed and posted this here

mayorovp Jan 8 2013 at 22:52

Структура, конечно же, храниться в стеке в таком случае не сможет. Но и отдельного блока памяти выделять также не будет.

-3

alexanderzaytsev Jan 9 2013 at 02:26

Если вы внимательно читали мой комментарий, который стоит выше по ветке, то я там сказал применительно к итераторам (попробуйте при использовании foreach разместить итератор в куче) и еще там было слово «обычно». Я нигде не говорил «структуры всегда хранятся в стеке», «итераторы всегда структуры» и «итераторы всегда хранятся в стеке».

UFO just landed and posted this here

alexanderzaytsev Jan 9 2013 at 05:51

Да, я это понял потом уже. Извините.

alexeyrom Jan 8 2013 at 16:00

Структура не размещается на стеке, например, если она — поле объекта. Или если она используется в каком-нибудь замыкании. blogs.msdn.com/b/ericlippert/archive/2009/04/27/the-stack-is-an-implementation-detail.aspx

corristo Jan 8 2013 at 16:52

весьма очевидно, нет?

Athari Jan 8 2013 at 20:54

Эрик, конечно, грамотный чувак, но в этой статье он гонит откровенную пургу, никак не связанную с реальностью. Ещё ни разу не видел, чтобы кто-то превращал class в struct, чтобы «копирование происходило по значению». Всегда — если требуется избежать лишней работы с кучей.

-2

UFO just landed and posted this here

Eirenliel Jan 9 2013 at 11:02

Просто использовать конструкции типа

for (A a : arrayListA) {
// some code
}

не допустимо в серьёзных местах. Лучше просто знать, какой list используется и как лучше его перебирать, а не доверять это for.

ashofthedream Jan 9 2013 at 13:47

[сарказм]Следуя вашему совету уже заменил 5287 for-ов на ручное перебирание.[/сарказм]

Eirenliel Jan 9 2013 at 15:51

Ваш сарказм не к месту, потому что я говорю об использовании

for(int i = 0; i < arrayList.size(); ++i) {

}

for(Iterator i = linkedList.iterator(); i.hasNext(); ) {

}

вместо

for (A a : arrayListA) {
// some code
}

-2

pleha Jan 9 2013 at 17:52

Кстати, просто массивы — это тоже часто не худшее решение. Нужна ли вообще та абстракция и структура данных которая используется?

ashofthedream Jan 9 2013 at 17:54

Я надеюсь вы в реальной жизни не следуете данному совету.

Noofiz Jan 8 2013 at 15:01

Спасибо. Очевидная вещь, кажется. Но никогда бы не обратил внимание. Было бы здорово посмореть как это конкретно повлияло на производительность процессора и памяти.

ramntry Jan 8 2013 at 15:27

Есть предположение, что на производительность процессора и памяти это либо никак не повлияло, либо даже снизило их — если владельцы сервиса на радостях по поводу бесплатной скорости решили перебросить его (сервис) на машинку послабее :)

tangro Jan 8 2013 at 15:33

>узкое место, которое на первый взгляд не вызвало бы ни у кого подозрений

Угу, 3 вложенных цикла не вызывали ни у кого подозрений. «Ничто не предвещало беды».

+47

doom369 Jan 8 2013 at 15:49

Вполне нормальная ситуация, если присутствует сложная иерархия. Я специально описал действие метода, чтобы можно было понять откуда это.

Breads Jan 8 2013 at 16:11

Дело не в том, что ситуация нормальная, а в том, что если иначе никак, лучше сразу думать над оптимизацией.

Nikelandjelo Jan 8 2013 at 16:36

Зачем сразу думать над оптимизацией? Написано было достаточно понятно и красиво. И сразу всё не заоптимизируешь. Особенно в начале проекта, когда не очевидно какие куски могут стать узким местом. Мне кажется читаемый код важнее, чем кривой, но более быстрый в крайних случаях, код. Если сразу думать над оптимизацией всюду, то можно застрять и не дожить до той поры, когда оптимизация даст плоды.

+10

tangro Jan 8 2013 at 17:05

Вы всё верно говорите, я просто заметил, что с того момента как проблемы с производительностью всё-таки возникли, как-то странно показывая код с тремя вложенным циклами называть его «местом, которое на первый взгляд не вызвало бы ни у кого подозрений».

UFO just landed and posted this here

Flammar Jan 9 2013 at 18:09

В принципе, можно сделать единый итератор по всем трём циклам сразу…

godin Jan 8 2013 at 15:45

Следует также отметить, что перебор элементов ArrayList через итератор c Sun JVM 1.6.0_05 был медленне чем через get — issues.apache.org/jira/browse/HARMONY-5920 Правда не помню когда пофиксили — толи в 1.7, толи вообще в 1.8. Думаю TheShade может сказать точнее ;)

UFO just landed and posted this here

tagir_valeev Jan 8 2013 at 17:11

Большая просьба к авторам при возникновении проблемы с производительностью или потреблением памяти в Java указывать хотя бы используемые JDK и JVM с указанием версии. Желательно также использованные ключи компиляции и Java-машины.

iZENfire Jan 8 2013 at 18:49

Почему-то никто не сказал, что коллекции могут спокойно изменяться в других нитях во время итераций по ним. Поэтому правильнее использование итераторов, а не простых счётчиков. Хотя это верно только в случае синхронизированных коллекций (или их мутабельных представителей), иначе — да, имеет смысл оптимизировать доступ к элементам через счётчик, а не через итератор.

ramntry Jan 8 2013 at 19:20

Как-то не очень хорошо обобщать в этой ситуации — «коллекции». Если коллекция не гарантирует доступа по индексу за константное время, то такая «оптимизация» может оказаться не совсем оптимизацией. Речь шла об ArrayList, для него да, ваше замечание интересно.

iZENfire Jan 8 2013 at 21:19

Так, прикладное программирование в том числе строится на обобщении механизмов работы с наборами объектов. Определённые контейнеры (кастомизации) коллекций — лишь частные случаи реализации того или иного механизма хранения/доступа. Итератор является обобщённым представлением паттерна «Визитёр» к коллекциям объектов, замена его счётчиком применительно к контейнеру типа ArrayList (одномерный массив) ведёт, естественно, к локальной оптимизации выполнения кода, но уменьшает абстракцию представления коллекции как таковой — раскрывает детали реализации. Что в будущем может затруднить рефакторинг кода в сторону использования иных коллекций, не имеющих доступа через механизм счётчика на основе целочисленного типа int, но имеющих объектный итератор.

-2

ramntry Jan 8 2013 at 21:35

Эм… Какое это всё имеет отношение к моему замечанию? А что такое «обобщённое представление к» чему-либо? Если я вас правильно понимаю, вы (зачем-то) заметили, что паттерн Visitor — частный случай паттерна Iterator. Осмелюсь предположить, что это не так. Я бы даже сказал, совсем не так. Предельно кратко: задача итератора — абстрагировать доступ (в том с числе с целью перебора) к элементам некоторой коллекции; посетителя — обеспечить двойную диспетчеризацию, а также облегчить добавление в систему новых операций над элементами некоторой сложной структуры ценой усложнения добавления новых видов элементов.

iZENfire Jan 8 2013 at 23:31

Паттерн Iterator реализует стратегию доступа к множеству объектов.
Паттерн Visitor реализует стратегию действия по отношению к самим объектам множества.
Улавливаете разницу?
(А что там про двойную диспетчеризацию и т.д. — это всё частности).

ramntry Jan 8 2013 at 23:34

Разницу? Стойкое впечатление, что вы читаете мои сообщения как-то наоборот. Я вам, собственно, про разницу и писал выше. Как и про то, что тема про паттерны совершенно ни к месту тут возникла.

iZENfire Jan 8 2013 at 23:42

Прошу прощения за грубую неточность в предложении: «Итератор является обобщённым представлением паттерна «Визитёр» к коллекциям объектов». Конечно же, Iterator никак не является обобщённым предствлением паттерна «Визитёр», так как у него несколько другая задача — перечислять объекты коллекции, а не работать с ними.

-1

ramntry Jan 8 2013 at 20:20

Стало мне интересно, а насколько медленнее доступ через итератор к элементу, чем по индексу для аналога ArrayList в С++ — для стандартного вектора? Получился вот такой очень простой тест и вот такие результаты.

tenzink Jan 8 2013 at 21:48

В общем всё как и должно быть: в релизной сборке разницы нет.

dborovikov Jan 8 2013 at 21:01

Кстати, если вам все же нужен именно связанный список, а не массив, то я бы посмотрел на специальные gc-эффективные реализации вроде FastList из Javolution.

skywatcher Jan 8 2013 at 22:31

В принципе код должен быть в первую очередь чистым, читабельным и поддаваться эффективной поддержке. Во вторую очередь уже он должен быть быстрым. То бишь, возможно какое-то место и не будет проблематичным.

P.S. Поздравляю вас с перформанс фиксом :)

Jedi_Knight Jan 8 2013 at 23:08

В общем случае (не ArrayList) поможет пул итераторов.

namespace Jan 8 2013 at 23:48

Кто-нибуть может мне объяснить реальные плюсы итераторов перед обращением по индексу.

Я вот в С++ делаю всегда так (например):

vector<int> q(magik.size());
magik.setContentsForVector(q);
for (unsigned int i = 0; i < q.size(); i++) {
   // тут идут обращения к q[i]
   // или к какому-то const Type var = &q[i]; (как-то так)
}

С итераторами особо не дружу, не знаю просто зачем они полезны, кроме интуитивности.

Да и [ ] это сложение адресов, а с итераторами — создание объектов.

-1

doom369 Jan 9 2013 at 00:21

Ну, есть коллекции, доступ к элементам которых по индексу получить нельзя. И если в Ваш метод может прийти одна из таких коллекций на ряду с индексными, то как написать универсальный метод без итератора?

leventov Jan 9 2013 at 00:27

А почему не for each?

namespace Jan 9 2013 at 03:24

Наверное потому что в С++ нету foreaсh, насколько мне известно.

-3

gribozavr Jan 9 2013 at 03:25

range-based for, C++11.

namespace Jan 9 2013 at 12:15

Ну уж простите, не у всех есть время разбираться с С++11 :) Но в любом случае, спасибо!

-3

ramntry Jan 9 2013 at 14:37

И еще костыль foreach в Qt и макрос BOOST_FOREACH (понятно, где)

ramntry Jan 9 2013 at 00:56

Если ваша задача — перебрать элементы std::vector<T> с целью их чтения или модификации — разницы действительно нет (почти, см. примечание). А вот дружить с ними стоит. Потому что:

1. Далеко не для всех коллекций, а вообще говоря, сущностей, содержащих некоторый конечный набор однотипных элементов, эффективен или даже возможен доступ по индексу. В C++ он возможен разве что для std::vector<T> и std::deque<T>, для них же и эффективен (требует константного времени), в Java же и ArrayList<T>, и LinkedList<T>, согласно интерфейсу List<T>, разрешают такой доступ, хотя эффективен он только для первого «списка» (который на самом деле массив ссылок, такой же псевдосписок есть в Qt — QList<T>), для второго требует линейного времени, что простой перебор элементов превращает в алгоритм с квадратичной сложностью. Для таких контейнеров, как множество и отображение (std::map<T>, например), доступ по индексу лишен смысла. Особенно для их unordered_* (в С++11) и Hash* (в Java) версий. И подавно такой доступ бессмысленен для потоков, они предоставляют только итераторы. В C++ STL это будут итераторы категорий InputIterator и OutputIterator (понятие «категория» еще часто именуют как Type Requirements, вещь из мира обобщенного или даже метапрограммирования). Например, std::ostream_iterator<T>. Есть множество потоков, например, в Boost.Spirit вы увидите, что интерфейс, с помощью которого взаимодействуют лексер и парсер — это пара итераторов (в стиле STL, категории ForwardIterator), абстрагирующих доступ к потоку лексем (или токенов). И это очень правильно, потому что резко снижает зависимости между частями системы, например, лексера может и не быть вовсе — а итераторы успешно предоставит, скажем, std::string.

2. Именно концепция итератора позволяет множеству замечательных алгоритмов STL работать с самыми разными коллекциями обобщенным образом. Алгоритмами этими нужно владеть, их надо знать, а это автоматически потребует от вас дружбы с итераторами.

3. Итератор — еще и некоторое обобщение ссылки или указателя на объект. Вы можете его сохранить в каком-нибудь другом объекте. Так вы сможете эффективно удалить или изменить какой-то элемент коллекции, не выполняя поиска. Конечно, тут нужно быть осторожным и знать, какие операции инвалидируют итераторы и ссылки, а какие нет, что индивидуально для каждой коллекции (и отдельная история в многопоточном случае). Практически не актуально для Java, так как удаление элемента даже в «настоящм» связном списке в ее случае инвалидирует все ранее созданные итераторы.

4. Итератор — еще и паттерн проектирования — вы можете использовать его в своих проектах. Тут я не буду останавливаться подробно, а отошлю к GoF.

Обещанное примечание. Разница все же есть, ибо использование итераторов может более менее существенно уменьшить число изменений, которые придется внести в код в случае изменения типа используемой коллекции. Почему такое изменение — не частый сценарий в реальности, можно почитать у Мейерса, «Эффективное использование STL» (как и о многом другом полезном)

Также предлагаю два замечания: о том, как стоит итерироваться по коллекциям в C++11 (не забывайте использовать константную ссылку, если не меняете элементы), и, в качестве примера, C++-way вывода на печать массива пользовательских структур (интересны 35-38 и 46 строчки)

namespace Jan 9 2013 at 12:17

Я думаю, вы расставили все точки над i — теперь мне все понятно. Спасибо!

blaze79 Jan 10 2013 at 09:39

не все так просто. во многих реализациях итератор у вектора это простой указатель, поэтому вставка или удаление элемента в вектор может аннулировать все его итераторы и можно подорваться на внешне безобидном коде

ramntry Jan 10 2013 at 11:33

Я об этом предупреждал, посмотрите внимательнее :) Фокус в том, что если вам нужна возможность безопасно удалять элементы по итератору (не инвалидируя остальные), то нужно использовать те коллекции, которые это гарантируют. Единственная условная сложность на этом пути — мне не известен удобный online-ресурс с хорошим поиском, в котором была бы предоставлена настолько детальная информация по стандартной библиотеке C++. А лазать в книжки и стандарты не очень удобно.

ramntry Jan 9 2013 at 01:06

Забыл прокомментировать

Да и [ ] это сложение адресов, а с итераторами — создание объектов.

А что вас заботит? Эффективность? Как показывает, в частности, маленький тест, проведенный мною выше, разницы в производительности в случае С++ нет никакой. В случае Java, как показывает самый этот пост, по-видимому, есть. Но это едва ли, снова таки, должно вас заботить до этапа профилирования, если в нем вообще возникнет необходимость.

namespace Jan 9 2013 at 12:17

До этапа профилирования

А как же, «Будь мужиком, пиши качественный код без профилера»?

ramntry Jan 9 2013 at 14:49

Тот факт, что преждевременная оптимизация — корень всех (или очень многих) зол, многократно обсуждался и в литературе, и здесь, на хабре. Я не хочу растекаться на эту тему. Замечу лишь, что думая о производительности, важно различать решения, уменьшающие константу в сложности алгоритма, и решения, улучшающие асимптотическую оценку сложности. Если вы себя поймали на том, что пишите кубический алгоритм, работающий с данными, которые предоставляются пользователем, и объем которых, соответственно, диктуется им — то может и стоит задуматься о производительности сразу. Здесь не тот случай.

namespace Jan 9 2013 at 15:05

Да какая преждевременная оптимизация? Если речь идет о узких местах, в них код сразу должен быть максимально быстрым и оптимальным. Каждая новая его модификация должна быть сопровождена соответствующими оптимизациями. Это же узкие места, дядя.

Если вы знаете, что где-то что-то можно ускорить — его нужно ускорять!

ramntry Jan 9 2013 at 15:09

А как вы выясняете, что является узким местом в проекте, до его запуска? Как показывает практика, метод «да ну бросьте, я точно знаю, что это — горячая точка» крайне часто приводит к ошибкам.

namespace Jan 9 2013 at 15:14

Если вы работаете над конкретным модулем (блоком) приложения, вы точно знаете сколько раз что может вызываться.

ramntry Jan 9 2013 at 15:20

Возможно. Наверное, этот спор лучше всего закончить так: зависит от того, что, для какой аудитории и зачем вы пишете.

namespace Jan 9 2013 at 15:31

Абсолютно верно.

ramntry Jan 9 2013 at 15:08

Вот, в "Стандартах программирования на С++" Саттер и Александреску советуют избегать алгоритмов со сложностью более, чем линейной. За подробностями — к ней, вообще хорошая книга. В той краткой форме, в которой я здесь привел этот совет, он может звучать абсурдно, так что — welcome

namespace Jan 9 2013 at 15:14

Спасибо.

Mrrl Jan 9 2013 at 18:10

Хороший совет. Особенно в сочетании с тем, что «ясность лучше хитроумия» :)

Mrrl Jan 9 2013 at 18:03

Если вы себя поймали на том, что пишите кубический алгоритм, работающий с данными, которые предоставляются пользователем, и объем которых, соответственно, диктуется им — то может и стоит задуматься о производительности сразу

Если выбирать приходится между N^3/32 и N^2*log(N), то думать придётся долго — надо будет прогнозировать, какой объём может предложить этот пользователь в обозримом будущем.

ramntry Jan 9 2013 at 18:43

Так как достоверно сравнивать константы у вас появится возможность только после реализации обоих вариантов, то ясно, что до профилировки всего приложения в целом вы или автоматом выберете n^2 * log(n) как подающий большие надежды, либо, что еще более вероятно, тот из них, которых проще в реализации, отладке, модификации, перспективнее с точки зрения переиспользования кода. А уж если возникнет необходимость выжать все, что можно… То вы реализуете оба, начнете сравнивать и… дабы не терять реализованное и отлаженное добро оставите и тот, и другой и будете переключаться между ними в зависимости от размера входных данных :)

mayorovp Jan 10 2013 at 10:50

Если начать выбирать между N^3/32 и N^2 * log N, то очень скоро станет очевидным, что второй вариант быстрее уже при N > 256.

Вот выбор между N^5/2^25 и другими вариантами действительно тяжел, особенно когда другие варианты еще не придуманы (кстати, реальный случай на полуфинале ICPC)

tbd Jan 9 2013 at 01:13

в С++ как раз частенько итераторы очень даже нужны
вот вам пример сходу (извините если вдруг, где-нибудь ошибся)

std::vector<int> a;
a.push_back(1);
a.push_back(2);
a.push_back(3);
int b[3] = {4,5,6};
int* c = new int[3];
c[0] = 7;
c[1] = 8;
c[2] = 9;
std::map<int, int> d;
d[1] = 10;
d[2] = 10;
d[3] = 10;
	
print(a.begin(), a.end());
print(&b[0], &b[0] + 3);
print(c, c + 3);
print(d.begin(), d.end());

где

std::ostream& operator << (std::ostream& stream, const std::pair<int, int>& element)
{
    stream << element.first + element.second;
    return stream;
}

template<class T>
void print(const T& begin, const T& end)
{
    for(T current = begin; current!=end;++current)
    {
        std::cout << (*current) << std::endl;
    }
}

ashofthedream Jan 9 2013 at 13:47

И как же ты в Set будешь обрашаться по индексу

namespace Jan 9 2013 at 13:49

А есть итераторы для множеств? Множество — ассоциативный контейнер.

ashofthedream Jan 9 2013 at 13:51

А почему его не должно быть? Списки, множества, очереди, стеки — все это частный вид коллекций, а коллекцию можно проитерировать.

namespace Jan 9 2013 at 13:58

Да нельзя проитерировать множество. Это ассоциативный контейнер. Его элементы не последовательны. А итератор — не зря этот паттерн называют «курсором».

Если вы со мной не согласны, напишите пример кода, в котором видно, что множество можно итерировать.

-1

mayorovp Jan 9 2013 at 14:14

В плюсах set — это сбалансированное дерево, то есть множество даже упорядочено. Почему бы его нельзя было итерировать?

В Java Set — это интерфейс, который может представлять как упорядоченное, так и неупорядоченное множества. Но даже в последнем случае итерация может иметь смысл (например, итерация применяется для копирования элементов между несовместимыми по реализации множествами).

Пример кода не приведу, но, как видно в docs.oracle.com/javase/6/docs/api/java/util/Set.html, Set наследует от Collection, который наследует от Iterable.

namespace Jan 9 2013 at 14:19

Хм. Почитал www.cplusplus.com/reference/set/set/ — оказалось что был неправ. Я всю жизнь думал, что set, как словарь — не упорядочен.

Спасибо.

mayorovp Jan 9 2013 at 14:20

^{(извиняюсь, поторопился)}

ashofthedream Jan 9 2013 at 14:34

Его элементы не последовательны.
В теории — да, на практике последовательность зависит от реализации. Если брать яву, то первое что нам приходит на ум это HashSet и TreeSet. Первый испольузет свою хешфункцию для проверки, второй — дерево.

Упорядоченность множества говорит нам о том, что мы достаем из него элементы не в том порядке в котором положили. К примеру запустив данный код:

Set<Integer> set = new HashSet<Integer>();
set.add(2038);
set.add(2012);
set.add(1970);
set.add(1408);
set.add(1337);

for(int e: set)
    out.println(e);

На выходе получим:

1337 1408 1970 2038 2012

Если вместо HashSet будем использовать TreeSet, то результат будет следующим:

1337 1408 1970 2012 2038

Словарь мы так же можем проитерировать, опять же, То что элементы не последовательны или неупорядочены не означает того, что мы не можем пройтись по всем элементам при помощи итератора. В одном случае это будет простой линейный проход по массву или списку, в другом — еще какая-нибудь хитрая итерация.

Flammar Jan 9 2013 at 17:14

Если «элементы не последовательны», то это значит только то, что (физическая) последовательность не специфицирована. Т.е. можно итерировать в любой последовательности, и это будет корректно.

Honeyman Jan 9 2013 at 01:29

(Вспомнил байку этак 15-летней давности, где какой-то подобный код, будучи скомпилирован новым тогда Intel C++ Compiler, развернулся в константу на стадии компиляции).

Какие эти императивные языки всё-таки сложные в оптимизации. Чуть повышаешь уровень абстракции — и всё, паттерн оптимизатору уже не виден.

quarantino Jan 9 2013 at 05:22

Стоит отметить, что такого рода оптимизация возможна в основном в случае ArrayList.

Можно оптимизировать и обход других коллекций, если перед циклами элементы записать во временный массив, используя toArray(). Итератор каждой коллекции отработает один раз, а дальше циклы будут просто брать элементы массивов. Тогда выигрыш может быть не только за счет меньшего числа созданных итераторов, но еще и за счет уменьшения overhead'а использования итераторов (взять элемент массива по индексу дешевле, чем get() или next()).

Но самое главное, конечно — это сидеть с профайлером и смотреть.

Flammar Jan 9 2013 at 17:04

Читабельность vs скорость: старая проблема… Зачем тут нужен полноценный ListIterator с hasPrevious() и previous()?

Flammar Jan 9 2013 at 17:28

А может просто итерироваться в самом внутреннем цикле по «самой длинной стороне»?

Mrrl Jan 9 2013 at 18:16

А у итераторов в этом языке нет операции «начать с начала»? Может быть, завести три итератора сразу, а в начале каждого цикла возвращать соответствующий итератор к началу массива?

UFO just landed and posted this here

Mrrl Jan 9 2013 at 19:32

Ну, в одном из комментариев я обнаружил строчку «Как известно, компилятор преобразовывает for цикл для коллекций в следующий код...» — а из неё следует, что используемая библиотека неплохо интегрирована с языком, раз компилятор позволяет себе пользоваться её функциями. А кроме того, много ли в наше время есть библиотек, которыми можно пользоваться без специальных ухищрений из более чем одного языка?

ramntry Jan 9 2013 at 20:14

А для этого языка, вроде бы, почти всегда достаточно знать, что все, что может объект, можно выяснить исходя из интерфейса. Они документированы и гуглятся хорошо: вот и вот про итераторы. Вот есть же отдельное для списков расширение интерфейса Iterator — ListIterator. Почему нет более развитой иерархии интерфейсов итераторов, среди которых были бы требующие от реализаций методов вроде reset() (из вашего вопроса), мне не известно.

Show the best of all time