Andrey2008 Nov 13 2019 at 11:57

Инкремент элементов вектора

13 min

17K

PVS-Studio corporate blogC++*Assembler*Compilers*

Translation

+103

Comments 65

UFO just landed and posted this here

lamerok Nov 13 2019 at 12:27

Похоже Travis Downs хотел что-то написать для микроконтроллера, потому что там такие вещи уже давно исследованы. И никто в здравом уме не будет делать проверку на границу цикла через вызов функции, всегда так и делали, задаешь константу и потом с ней уже сравниваешь.

Справедливости ради, стоит заметить, что вектор для микроконтроллеров редко используют, вместо этого array, у которого size() это constexpr выражение, поэтому там таких проблем и нет.

И да лучше использовать вообще цикл с обходом диапазона.

-2

UFO just landed and posted this here

vamireh Nov 13 2019 at 15:03

никто в здравом уме не будет делать проверку на границу цикла через вызов функции, всегда так и делали, задаешь константу и потом с ней уже сравниваешь

Это проистекает не из здравости ума, а из святой до наивности убеждённости этих разработчиков в том, что если написан вызов функции, то он будет на каждой итерации. Хотя здесь проблема вовсе не в том, что компилятор не умеет оптимизировать, а в том, что не имеет права. Про алиасинг большинство людей, вводящих константу, не только не подумает, а даже и не знает. Как следствие, это выстрелит в другом месте их кода.

UFO just landed and posted this here

PyerK Nov 14 2019 at 12:50

В старом с++ на некоторых контейнерах size() имел линейную сложность. Это была жизненная необходимость выносить его из тела цикла.

UFO just landed and posted this here

vamireh Nov 14 2019 at 13:45

В «старом» C++ только у std::list метод size мог быть линейным, а мог быть и константным — реализациям предоставлялся выбор. Это сейчас комитет (очевидно, под давлением M$) принял генитальное решение сделать std::list::size константным — в результате в стандартной библиотеке у нас больше нет такого абстрактного типа данных как «двусвязный список».

UFO just landed and posted this here

vamireh Nov 14 2019 at 16:58

Ой, правда что ли? :)
Скажите, а почему тогда

splice(const_iterator pos, list& other, const_iterator first, const_iterator last)

для случая this != &other даёт линейную сложность от std::distance(first, last)?

UFO just landed and posted this here

vamireh Nov 14 2019 at 18:12

Если речь заходит о чуть более специфических операциях, то всё становится куда интереснее, так как константный size() позволяет реализовать ряд других методов (которые, ИМХО, используются как минимум не реже) более эффективно. Howard Hinnant об этом хорошо писал в своё время.

Если есть подобная необходимость, то можно подсчитывать размер внешними средствами. Т.е. из двусвязного списка сделать особую химеру имени std довольно легко, а вот наоборот — нет.

GCU Nov 14 2019 at 19:00

Похоже Ваше мнение о сложности std::list не популярно, как и моё :).
По сути «химера» это лишь дополнительное поле размера, которое создаёт линейную сложность лишь при вставке части от другого списка.
Однако при вставке другого списка целиком — сложность константна (т.к. размер вставляемого списка известен).

Исходя из структуры данных «двусвязный список», линейная сложность вставки куска из другого списка действительно «сюрприз». Но для универсальной библиотеки контейнеров это лучше, так как многие другие операции будут эффективнее. Это можно понять и простить :).

vamireh Nov 14 2019 at 19:08

По сути «химера» это лишь дополнительное поле размера, которое создаёт линейную сложность лишь при вставке части от другого списка

Реализация понятна. Речь о внешнем поведении.

Однако при вставке другого списка целиком — сложность константна (т.к. размер вставляемого списка известен)

Какая половая разница известен нам размер или нет? У двусвязного списка вставка куска другого списка всегда константна, вне зависимости от того, представляет ли этот кусок весь список или его часть. Так что здесь никакой «прибавки» нет.

Но для универсальной библиотеки контейнеров это лучше

Для универсальной библиотеки контейнеров лучше, что в ней нет реализации двусвязного списка? Оригинальный подход — с таким надо идти в комитет по стандартизации :)

так как многие другие операции будут эффективнее

Во-первых, как я и говорил, сделать химеру легко и поверх. Во-вторых, вполне возможно, что при таких требованиях нужна другая структура данных.

-1

mobi Nov 15 2019 at 14:19

Наверное, никто не мешает сделать реализацию, в которой при выполнении splice внутреннее поле размера устанавливается в -1 и будет пересчитано автоматически при выполнении последующих операций, требующих знания размера.

vamireh Nov 15 2019 at 15:36

Совершенно точно этому мешает всё. И не только весьма странная попытка в беззнаковый тип данных впихнуть -1, но ещё и нарушение требований асимптотики «последующих операций». Так что не говорите, пожалуйста, ерунды.

vamireh Nov 14 2019 at 13:38

Во-во-во, советы двадцатилетней давности как догмат современной разработки. Я об этом и говорю.

Tsvetik Nov 13 2019 at 12:36

Мда, все больше разочаровываюсь в C++. Почему же, чтобы написать простой цикл надо так извращаться?

-3

Enjection Nov 13 2019 at 12:53

А если бы вы читали статью внимательнее, то заметили бы:

А как же for-цикл с обходом диапазона, появившийся в C++11?

Спешу вас обрадовать: он работает! Это, по сути, синтаксический сахар, за которым скрывается почти в том же виде наша версия с итератором, где мы фиксировали указатель end в локальной переменной до начала цикла. Так что быстродействие у него то же.

+13

PsyHaSTe Nov 18 2019 at 03:04

Но если прочитать еще дальше, то там предупреждение, что все может случайно сломаться если компилятору покажется что какие-то другие данные могут алиаситься.

bfDeveloper Nov 13 2019 at 12:58

При чём тут C++? Заметьте, код корректно работает во всех версиях, дело только в производительности. Ну а то, что для написания производительного кода приходится закапываться в асм и архитектуру процессора, никогда никого не удивляло.

ss-nopol Nov 13 2019 at 15:43

Возможно потому что здесь (на первый взгляд) нарушается основополагающий принцип C++ Don’t pay for what you don’t use

Мы теряем производительность из-за возможности изменять размер вектора, которая не используется. То есть платим за то, что не используем.

При этом вектор в С++ позиционируется как безопасная замена массива из С, работающая без потери производительности.

bfDeveloper Nov 13 2019 at 16:02

Так вектор и не теряет. Немного маскирует. На чистом uint8_t* вы получите ту же самую беду с алиасингом, если не как автор в примере с указателем передадите по значению, а создадите свой struct с указателем и длинной и передадите указтель на этот самый struct. Это очень часто используется в C для всевозможных массивов и буферов и точно так же стреляет.

UFO just landed and posted this here

GCU Nov 13 2019 at 14:39

В коде написаны явные вызовы size() и оператора индексирования [] для каждого элемента массива. Для такой простой операции как увеличить на 1 — это может быть довольно накладно.
Код работает даже лучше, чем написан. В чём извращение? :)

Tsvetik Nov 13 2019 at 15:03

Перечитал статью еще раз и разобрался в испытываемых чувствах. Как человек из мира С, не обратил внимание, что [] — это все-таки оператор, перегруженный в std::vector, а v.size() его метод, который не обязан быть константным.

UFO just landed and posted this here

GCU Nov 14 2019 at 11:09

А почему люди должны быть с ним согласны?
Я, например, не согласен с тем что они «улучшили» сложность size() в std:list до константы за счёт других операций.
Стандарт можно только понять и простить :)

-1

Videoman Nov 13 2019 at 18:11

Не надо. Это как-раз хорошая иллюстрация на тему преждевременной оптимизации. Не нужно всегда и везде добиваться предельно возможной скорости. Только если профайлер показал в таком цикле hot spot, только в этом случае нужно «извращаться», как вы выразились. Но тогда это уже придется делать на любом языке, иной раз с гораздо большими затратами по сложности и времени.

UFO just landed and posted this here

bfDeveloper Nov 13 2019 at 12:54

Спасибо за перевод. У меня появился ещё один аргумент в войне за возвращение strict aliasing в проект. К сожалению сейчас по причинам зависимостей и глубокой истории включен -fno-strict-aliasing. Он вообще абсурдно популярен. С одной стороны люди не хотят разбираться с правилами и багами оптимизированного билда, но с другой иногда существенно теряют в производительности, что и показано в статье.

danfe Nov 14 2019 at 05:08

Он вообще абсурдно популярен.

Реальность, к сожалению, такова, что очень много кода ломается при строгом алиасинге разными неочевидными способами (когда-то обсуждали в этом топике).

Aldrog Nov 13 2019 at 13:48

Интересно. Проверил исходную версию кода на gcc 9.2 и i7-8700, результаты совсем другие:

O1
8-bit test: 0.051112 ms
32-bit test: 0.059481 ms
O2
8-bit test: 0.008815 ms
32-bit test: 0.006372 ms
O3
8-bit test: 0.000545 ms
32-bit test: 0.00189 ms
O3 + march=native
8-bit test: 0.000387 ms
32-bit test: 0.001062 ms

Aldrog Nov 13 2019 at 13:51

Да и на gcc 8 восьмибитная версия быстрее получается...

bfDeveloper Nov 13 2019 at 16:09

Нет возможности запустить бенчмарк, но дизасм на gcc 9.2, да и на любом другом, такой же, как у автора статьи: godbolt.org/z/VtCGU4

ianzag Nov 13 2019 at 14:22

PVS-Studio умудрились набросать интересную статью так ни разу и не вставив картинку с единорогом :) Удивительно.

mayorovp Nov 13 2019 at 17:15

Это ж перевод.

KindDragon Nov 13 2019 at 15:56

Хочу заметить что с range-based for компилятор генерирует код такой же как ваш лучший вариант https://gcc.godbolt.org/z/f84s8e .

svr_91 Nov 13 2019 at 16:13

А если заменить на какой-нибудь std::for_each или std::transform?

PyerK Nov 13 2019 at 17:16

Вчера игрался с ranged for и по неизвестной мне причине он отрабатывал кратно быстрее чем min_element. min_element упорно не хотел векторизоваться.

UFO just landed and posted this here

Videoman Nov 13 2019 at 18:15

Очевидно — нельзя будет менять вектор и код не скомпилируется.

DistortNeo Nov 13 2019 at 20:17

Не поможет даже теоретически. Наличие const-квалификаторов не влияет на оптимизацию кода, насколько я знаю.

UFO just landed and posted this here

fougasse Nov 13 2019 at 23:11

В С++ приняты два понятия неизменяемости — "логическая" и "физическая".
Даже ключевое слово сделали для таких фокусов.
Не очень понятно, что даст возможность вектора только расти в плане безопасности, ведь наступит реаллокация и всё.

UFO just landed and posted this here

fougasse Nov 14 2019 at 10:00

Каким образом?
Вектора растут не монотонно.

Aldrog Nov 14 2019 at 11:54

При итерации по индексу, как в статье, действительно поможет. Для итераторов — нет.
Рост — это монотонное изменение размера по определению.

fougasse Nov 14 2019 at 12:40

в многопоточной среде?

Aldrog Nov 14 2019 at 12:58

Конкретно в примере из статьи да, добавление элементов в конец вектора из другого потока ничего не сломает. В чуть более сложном случае может и сломать, так что в целом предложение PeterK я тоже не совсем понимаю.

Videoman Nov 14 2019 at 13:30

Смелое утверждение. Там же сплошные гонки. Как только вектор превысит capacity, будет полная переаллокация с перемещением элементов. В какой-то момент инкремент будет по удаленному куску памяти — 100%.

Aldrog Nov 14 2019 at 13:38

Да, согласен, ошибся. Даже в этом примере инкремент не атомарный, так что проблемы будут.

UFO just landed and posted this here

fougasse Nov 13 2019 at 22:28

лучше на std::array, но это уже другая история

UFO just landed and posted this here

PyerK Nov 14 2019 at 12:57

fougasse Nov 14 2019 at 21:23

страдания на 6й студии, понимаю

neurocore Nov 14 2019 at 09:29

Ох, тут SIMD'у есть где разгуляться

RSATom Nov 14 2019 at 10:12

А почему в вынесении v.size() за пределы цикла мы на компилятор не полагаемся, но при этом верим что i++ это правильно?

bfDeveloper Nov 14 2019 at 12:53

Потому что про i++ компилятор имеет и прав, и возможность убрать лишние операции, превратив в ++i, а v.size() выносить за пределы цикла нет. Если я, конечно, правильно понял вашу претензию к i++

PyerK Nov 14 2019 at 13:06

Конкретно для POD типов компилятор так умеет. На остальных классах это не всегда возможно из-за природы постинкремента.
Некоторые программисты считают что лучше выработать у себя дефолтный стиль кода, который правильный в большем числе случаев (например по умолчанию всё конст, по умолчанию прединкремент, по умолчанию всегда RAII etc). И пост инкремент использовать только в том контексте, где он имеет смысл.

perfect_genius Nov 21 2019 at 13:07

Надо бы ещё в хабы «Ассемблер» и «Высокая производительность» — чуть не пропустил статью из-за этого.

EviLOne Nov 21 2019 at 23:59

давно для себя усвоил, если память позволяет, то нужно работать в родной размерности вычислительной системы, уменьшать смысла нет. Это я про МК