Comments 17
График без подписей показывает снижение а не рост…
>интринзик
www.google.ru/search?q=%D0%B8%D0%BD%D1%82%D1%80%D0%B8%D0%BD%D1%81%D0%B8%D0%BA&ie=utf-8&oe=utf-8&gws_rd=cr&ei=YnaQVJCeL6GfygOBgIGgBQ#newwindow=1&q=%D0%B8%D0%BD%D1%82%D1%80%D0%B8%D0%BD%D0%B7%D0%B8%D0%BA
интринсик же…
P.S: Попробуйте отдавать на рецензирование перед публикацией. Незамыленный глаз хорошо косяки распознает.
>интринзик
www.google.ru/search?q=%D0%B8%D0%BD%D1%82%D1%80%D0%B8%D0%BD%D1%81%D0%B8%D0%BA&ie=utf-8&oe=utf-8&gws_rd=cr&ei=YnaQVJCeL6GfygOBgIGgBQ#newwindow=1&q=%D0%B8%D0%BD%D1%82%D1%80%D0%B8%D0%BD%D0%B7%D0%B8%D0%BA
интринсик же…
P.S: Попробуйте отдавать на рецензирование перед публикацией. Незамыленный глаз хорошо косяки распознает.
0
UFO just landed and posted this here
Можно. А где было нельзя?
0
>>Увы, но прирост не вседа удаётся получить от перехода на SSE/AVX. :(
Да, действительно такая ситуация бывает, но тут следует подумать, а поддается ли данный алгоритм векторизации или нет? Если нет, то значит нет, но иногда после долгих размышлений удается все-таки получить прирост посредством алгоритмической оптимизации или эффективного использования кэша, памяти или даже за счет большего количества вычислений, если эта тема интересна, то я мог бы поделиться такими примерами.
>>А в новом AVX уже можно работать сразу со всем регистром как с единым?
>>Те не как с пачкой 8/16/32/64 битных, а как с 128/256/512 битным, например сдвигать, >>складывать, вычитать?
я понимаю о чем речь, и да, такие бы инструкции побитового сдвига, сложения были бы востребованы, но мне об их наличии неизвестно
Да, действительно такая ситуация бывает, но тут следует подумать, а поддается ли данный алгоритм векторизации или нет? Если нет, то значит нет, но иногда после долгих размышлений удается все-таки получить прирост посредством алгоритмической оптимизации или эффективного использования кэша, памяти или даже за счет большего количества вычислений, если эта тема интересна, то я мог бы поделиться такими примерами.
>>А в новом AVX уже можно работать сразу со всем регистром как с единым?
>>Те не как с пачкой 8/16/32/64 битных, а как с 128/256/512 битным, например сдвигать, >>складывать, вычитать?
я понимаю о чем речь, и да, такие бы инструкции побитового сдвига, сложения были бы востребованы, но мне об их наличии неизвестно
0
UFO just landed and posted this here
Сдвиг SSE вектора как целого — _mm_slli_si128 / _mm_srli_si128.
0
Так как я занимаюсь оптимизацией алгоритмов обработки изображений, то меня особенно интересует работа с 16-bit и 8-bit целыми значениями. Поэтому мне приходится активно использовать SSE2, SSSE3, SSE4.1 и AVX2 векторные расширения. На сколько я понял из документации, в AVX-512 есть только операции для работы с целыми 64-bit и 32-bit числами.
Вопрос: когда стоит ожидать появление в процессорах Intel 512-bit векторов с поддержкой операций с 16-bit и 8-bit целыми значениями?
Вопрос: когда стоит ожидать появление в процессорах Intel 512-bit векторов с поддержкой операций с 16-bit и 8-bit целыми значениями?
0
Похоже, вам нужно это: software.intel.com/en-us/node/534473 (AVX512{BW,DQ})
0
Да, Вы правы 16 и 8 бит целых пока нет, но скажем так, вспомните как вышел AVX и AVX2.
0
Sign up to leave a comment.
Поэтапный рост производительности при применении векторных инструкций перестановки от SSE до AVX3.1