Comments 5
Спасибо за перевод, но
И
точечное произведениену серьезно, даже Google Translate переводит «dot product» правильно.
И
У него 8-битные регистры с плавающей запятой«8-wide» там означает 8 значений по 32bit float.
+3
1) Не случается ли проседания производительности при переключении между avx2 инструкциями и обычными?
2) С какими опциями оптимизации компилировался исходный код?
3) Есть ли смысл в микрооптимизациях типа (vertex_count & ~7)? Нельзя ли сразу писать vertex_count % 8?
2) С какими опциями оптимизации компилировался исходный код?
3) Есть ли смысл в микрооптимизациях типа (vertex_count & ~7)? Нельзя ли сразу писать vertex_count % 8?
0
1) Вроде как на последних Core оверхед сведен к минимуму
+1
Не случается ли проседания производительности при переключении между avx2 инструкциями и обычными?
При компилировании в AVX-таргет, SSE-инструкции тоже генерируются в схеме кодирования инструкций VEX, что позволяет выполнять без пенальти.
The AVX instructions support both 128-bit and 256-bit SIMD. The 128-bit versions can be useful to improve old code without needing to widen the vectorization, and avoid the penalty of going from SSE to AVX
+1
Sign up to leave a comment.
Articles
Change theme settings
Разновидности SIMD