Comments / Profile of izard / Habr

How to become an author

Alexander Komarov @izard

software optimization

Profile Publications 21Comments 351Bookmarks 356

Русская микроэлектроника и украинский IoT на конференциях SVOD и IoT DevCon в Силикон Вэлли

izard May 31 2016 at 12:44

Юрий, отличный пост! Но уж очень разные темы подняты, и их слишком много для нормального восприятия как цельной статьи. Например, та часть, что о беседах с «техно-феминистками», очень хороша; мог бы получиться отличный отдельный пост об особенностях карьеры.

0

CAT — Управление размером кэша процессора

izard Feb 16 2016 at 18:09

А, тогда ладно. Но бранч предикт, кэширование, simd и gpu принципиально на arm не отличается. Так что вся эта гонка за % CPI за счет небольшой оптимизации текущих боттлнеков в конвейере продолжается надолго. Есть конечно и технологии 90х а не 70х, но про них, когда/если придет время, расскажет большой босс на IDF.

+1

CAT — Управление размером кэша процессора

izard Feb 16 2016 at 17:26

Архитектурные энергозатраты? Вы имеете в виду декодер x86 инструкций во фронтенде? Посмотрите на кристалл даже не Xeon, а Атом, и найдите сколько он по площади занимает. Лет 15 назад это еще был какой-то ощутимый %, а теперь — сотые доли % если не тысячные.

0

CAT — Управление размером кэша процессора

izard Feb 16 2016 at 11:26

А зачем это Интел? Несколько лет назад появились серверные Арм, и одновременно появились сервера на Атом с соответствующим энергопотреблением.

+4

Лаборатория роботехники и девушки в Сколково

izard Nov 30 2015 at 17:51

Там серферы есть, значит есть где недорого взять напрокат wetsuit, и купаешься сколько влезет.

0

Самая медленная инструкция x86

izard Jun 8 2015 at 14:26

Если с splitlock как в примере, то несущественная. Если без сплитлока, надо измерять, не знаю так.

0

Самая медленная инструкция x86

izard Jun 8 2015 at 14:25

AVX и SSE содержат достаточно простые инструкции. Скорее всего, если на них написать свой логарифм, может быть быстрее.

0

Самая медленная инструкция x86

izard Jun 8 2015 at 14:24

Только чтобы подключить старое железо — старше broadwell и skylake, или редкое/мелкое. Весь зоопарк постоянно держать подключеным места не хватает, да и зачем — очень редко нужно.

0

Проверяем открытый исходный код UEFI для Intel Galileo при помощи PVS-Studio

izard May 26 2015 at 12:43

Спасибо, перешлю ссылку на google translate статьи человеку, который должен знать разработчиков quark EDK2

+2

Самая медленная инструкция x86

izard May 22 2015 at 23:39

Да, выше уже написали, что еще это может быть особенно дорого на Xeon-EX, там NUMA особенно злая.

0

Самая медленная инструкция x86

izard May 21 2015 at 21:22

Можно, даже если другие VM работают на других ядрах. Но для многопроцессорного сервера — только соседей по процессору. VM можно запрограмировать это ловить и давать таким гостям совсем мало тактов, но вроде это нигде пока не реализовано.

0

Самая медленная инструкция x86

izard May 21 2015 at 16:02

А, это от vtune осталось, иначе ивенты не ловились. Конечно можно один раз померить, будет несколько тысяч циклов. Спасибо, поправлю.

+2

Самая медленная инструкция x86

izard May 21 2015 at 13:46

да, я что-то код сверху не могу заставить тормозить, исполняю как раз на HSW. Схожу в лабу на SNB проверю, как раз выдран с реального кода на SNB.

+1

Самая медленная инструкция x86

izard May 21 2015 at 12:01

WBINV надо быть в ring 0, ее неожиданно в пользовательском коде оказаться не может. Кстати, она сама не очень медленная, тормоза начинаются потом, когда оказывается что кэш пустой.

+2

Самая медленная инструкция x86

izard May 21 2015 at 12:00

В Atom еще почти независимое. Но даже там в этом микрокоде полно load/store, которые занимают обычные порты. а в HSW core просто 8 портов, некоторые содержат в том числе execution units, работающие с fp.

+2

Самая медленная инструкция x86

izard May 21 2015 at 11:44

Эта инструкция декодируется в длинный микрокод, так что нет (то есть этот микрокод, понятно, ипользует ILP внутри себя, но следующие инструкции ждут).

+3

Самая медленная инструкция x86

izard May 21 2015 at 11:43

Да, десятки и сотни, все примеры из статьи кроме fy2x — тысячи.

0

Самая медленная инструкция x86

izard May 21 2015 at 11:42

Сейчас проверю последний раз этот пример я запускал 2 года назад. Наверное, -fast-math включился, он отбрасывает denormals. Но код вроде правильный сгенерился.

+3

Практикум «Intel IoT». Edison — могучая «кроха»

izard Apr 25 2015 at 11:17

Для wifi/bluetooth на галилео оч. рекомендую minip-pcie типа Intel N135 или 6250

+1

Практикум «Intel IoT». Edison — могучая «кроха»

izard Apr 25 2015 at 11:16

апгрейд прошивки через reboot ota не на 100% совместим с последней официальной прошивкой. Ее надо прошивать через flashall.sh, который находится в корневом каталоге.

+1

3

4 5 ...