Pull to refresh

Comments 5

Так как размер переменной типа int в x32 и x64 процессорах не равно 4 байта....

Так а чему же тогда оно равно?

«movdqa (%0), %%xmm0\n»

а то же самое нельзя написать без ассемблера с intrinsics либой?
При этом с avx512 можно бы и 64 байта за раз а не 16
Кстати вначале можно определять не выровнен ли первый блок и копировать 0-7 байт для выравнивания, чтобы юзер не заморачивался с выравниванием.
И неплохо бы сравнение со стандартным memcpy, неужели вы в такой старой вещи сделали открытие?
UFO just landed and posted this here
Sign up to leave a comment.

Articles

Change theme settings