Pull to refresh
0
0
Send message
Скомпилировал все примеры под Эльбрусом. (переделав на си)
Несколько замечаний.
1) результаты, похожие на ваш, (но не в 7 раз), получаются при опциях
-fforce-vect -fvect-verbose
2) неоднократно замечал, что unroll у МЦСТ коряво работает даже в простых случаях…
3)Запустил с оптимизацией O3 (да да, у МЦСТ очень даже рабочая), и все ваши оптимизации коту под хвост.
t0-t1 45.814001 (первый случай, мкс.) время на обработку 256 массивов по 256.
t0-t1 369.018002(второй случай)
t0-t1 382.902000l(3-й случай.)
4) вместо радости рекомендую еще prefetch сделать.

Information

Rating
Does not participate
Registered
Activity