a_bakshaev Dec 16 2014 at 09:26

Поэтапный рост производительности при применении векторных инструкций перестановки от SSE до AVX3.1

13 min

Intel corporate blogWebsite development*Programming*

Comments 17

DustCn Dec 16 2014 at 21:15

График без подписей показывает снижение а не рост…

>интринзик
www.google.ru/search?q=%D0%B8%D0%BD%D1%82%D1%80%D0%B8%D0%BD%D1%81%D0%B8%D0%BA&ie=utf-8&oe=utf-8&gws_rd=cr&ei=YnaQVJCeL6GfygOBgIGgBQ#newwindow=1&q=%D0%B8%D0%BD%D1%82%D1%80%D0%B8%D0%BD%D0%B7%D0%B8%D0%BA

интринсик же…

P.S: Попробуйте отдавать на рецензирование перед публикацией. Незамыленный глаз хорошо косяки распознает.

blueboar2 Dec 17 2014 at 07:12

Еще и не SSE а SSSE

a_bakshaev Dec 17 2014 at 11:52

спасибо большое за отзыв, учту обязательно.

UFO just landed and posted this here

Gumanoid Dec 17 2014 at 04:29

Можно. А где было нельзя?

Gumanoid Dec 17 2014 at 17:37

А, вопрос был про использование {x,y,z}mm регистров в качестве скаляров, а не векторов.
Я подумал про что-то вроде ARM NEON, когда 128-битный векторный регистр на самом деле состоит из 4 32-битных.

a_bakshaev Dec 17 2014 at 12:10

>>Увы, но прирост не вседа удаётся получить от перехода на SSE/AVX. :(
Да, действительно такая ситуация бывает, но тут следует подумать, а поддается ли данный алгоритм векторизации или нет? Если нет, то значит нет, но иногда после долгих размышлений удается все-таки получить прирост посредством алгоритмической оптимизации или эффективного использования кэша, памяти или даже за счет большего количества вычислений, если эта тема интересна, то я мог бы поделиться такими примерами.
>>А в новом AVX уже можно работать сразу со всем регистром как с единым?
>>Те не как с пачкой 8/16/32/64 битных, а как с 128/256/512 битным, например сдвигать, >>складывать, вычитать?
я понимаю о чем речь, и да, такие бы инструкции побитового сдвига, сложения были бы востребованы, но мне об их наличии неизвестно

UFO just landed and posted this here

a_bakshaev Dec 17 2014 at 16:04

Да, для криптографии было бы полезно иметь такие сдвиги.

UFO just landed and posted this here

ErmIg Dec 17 2014 at 10:50

Сдвиг SSE вектора как целого — _mm_slli_si128 / _mm_srli_si128.

a_bakshaev Dec 17 2014 at 12:15

Наверно, Ivan_83, имел в виду побитовый сдвиг, а данные инструкции сдвигают байты, и реализовать побитный сдвиг регистра как единого уже есть некие сложности

ErmIg Dec 17 2014 at 12:20

Может быть вы и правы, хотя я не совсем представляю зачем сдвигать побитно весь 128-bit вектор целиком.

ErmIg Dec 17 2014 at 10:58

Так как я занимаюсь оптимизацией алгоритмов обработки изображений, то меня особенно интересует работа с 16-bit и 8-bit целыми значениями. Поэтому мне приходится активно использовать SSE2, SSSE3, SSE4.1 и AVX2 векторные расширения. На сколько я понял из документации, в AVX-512 есть только операции для работы с целыми 64-bit и 32-bit числами.

Вопрос: когда стоит ожидать появление в процессорах Intel 512-bit векторов с поддержкой операций с 16-bit и 8-bit целыми значениями?

irishrover Dec 17 2014 at 12:33

Похоже, вам нужно это: software.intel.com/en-us/node/534473 (AVX512{BW,DQ})

a_bakshaev Dec 17 2014 at 12:47

Да, Вы правы 16 и 8 бит целых пока нет, но скажем так, вспомните как вышел AVX и AVX2.

irishrover Dec 17 2014 at 12:51

В SKX есть: AVX512BW-инструкции.