Pull to refresh

Comments 17

График без подписей показывает снижение а не рост…

>интринзик
www.google.ru/search?q=%D0%B8%D0%BD%D1%82%D1%80%D0%B8%D0%BD%D1%81%D0%B8%D0%BA&ie=utf-8&oe=utf-8&gws_rd=cr&ei=YnaQVJCeL6GfygOBgIGgBQ#newwindow=1&q=%D0%B8%D0%BD%D1%82%D1%80%D0%B8%D0%BD%D0%B7%D0%B8%D0%BA

интринсик же…

P.S: Попробуйте отдавать на рецензирование перед публикацией. Незамыленный глаз хорошо косяки распознает.
спасибо большое за отзыв, учту обязательно.
UFO just landed and posted this here
Можно. А где было нельзя?
А, вопрос был про использование {x,y,z}mm регистров в качестве скаляров, а не векторов.
Я подумал про что-то вроде ARM NEON, когда 128-битный векторный регистр на самом деле состоит из 4 32-битных.
>>Увы, но прирост не вседа удаётся получить от перехода на SSE/AVX. :(
Да, действительно такая ситуация бывает, но тут следует подумать, а поддается ли данный алгоритм векторизации или нет? Если нет, то значит нет, но иногда после долгих размышлений удается все-таки получить прирост посредством алгоритмической оптимизации или эффективного использования кэша, памяти или даже за счет большего количества вычислений, если эта тема интересна, то я мог бы поделиться такими примерами.
>>А в новом AVX уже можно работать сразу со всем регистром как с единым?
>>Те не как с пачкой 8/16/32/64 битных, а как с 128/256/512 битным, например сдвигать, >>складывать, вычитать?
я понимаю о чем речь, и да, такие бы инструкции побитового сдвига, сложения были бы востребованы, но мне об их наличии неизвестно
UFO just landed and posted this here
Да, для криптографии было бы полезно иметь такие сдвиги.
UFO just landed and posted this here
Сдвиг SSE вектора как целого — _mm_slli_si128 / _mm_srli_si128.
Наверно, Ivan_83, имел в виду побитовый сдвиг, а данные инструкции сдвигают байты, и реализовать побитный сдвиг регистра как единого уже есть некие сложности
Может быть вы и правы, хотя я не совсем представляю зачем сдвигать побитно весь 128-bit вектор целиком.
Так как я занимаюсь оптимизацией алгоритмов обработки изображений, то меня особенно интересует работа с 16-bit и 8-bit целыми значениями. Поэтому мне приходится активно использовать SSE2, SSSE3, SSE4.1 и AVX2 векторные расширения. На сколько я понял из документации, в AVX-512 есть только операции для работы с целыми 64-bit и 32-bit числами.

Вопрос: когда стоит ожидать появление в процессорах Intel 512-bit векторов с поддержкой операций с 16-bit и 8-bit целыми значениями?
Да, Вы правы 16 и 8 бит целых пока нет, но скажем так, вспомните как вышел AVX и AVX2.
Sign up to leave a comment.