Как стать автором
Обновить

Комментарии 10

Спасибо! Интересная статья. Пробовали ли вы использовать возможности, например, OpenMP 4.5 (или какие-либо другие технологии) для применения векторизации вместо интринсиков, чтобы снизить расходы на реализацию и поддержку кода и новых наборов инструкций? Если пробовали, насколько различается производительность на разных поколениях hardware?
Здравствуйте. С OpenMP 4.5 не работал. В современных компиляторах достаточно неплохо работает автовекторизация кода. К сожалению, она хорошо работае только для тривиальных случаев. Чуть что посложнее — и приходится ручками оптимизировать. Например, я совершенно не представляю, как бы компилятор справился с автовекторизацией алгоритма из статьи.
Да, я понимаю. Про OpenMP я спросил, так как эта технология позволяет векторизовать код используя директивы препроцессора.
Они в каком-то смысле помогают компилятору справится с векторизацией и оптимизацией кода.
Прошу прощения, промахнулся с сеткой.
Подскажите, пожалуйста, где еще можно посмотреть на фотографии Лены? Данная часть статьи заинтересовала больше всего!
вы используете буквально пару инструкций из SSE4.1. Можно с минимальными изменениями адаптировать код под sse2/sse3, для более старых процов.
Да. Можно. Мне наверное не сильно сложно было бы добавить. Но на сколько это актуально?
НЛО прилетело и опубликовало эту надпись здесь
Не везде есть возможность работать на GPU. Да и не все алгоритмы на GPU хорошо ложатся.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории