Комментарии / Профиль marsianin / Хабр

@marsianin

Пользователь

Профиль Публикации Комментарии 184Закладки 285

Wired: «около дюжины обезьян» пришлось усыпить после вживления чипа Neuralink

marsianin 21 сен 2023 в 19:54

А как этот "комитет" предлагает тестировать подобные вещи, если не на животных?

+31

Посмотреть

Made at Intel. Женские истории

marsianin 11 авг 2023 в 18:32

Ну, ради справедливости, ещё не во всём интеле бранчи master переименовали, остались пока ещё адекватные менеджеры.

нужно было найти нового работника - девушку

Я ни в коем случае не оспариваю. Но вроде бы во всех гайдлайнах по найму сказано, что нельзя предъявлять требования к полу и возрасту.

Посмотреть

Made at Intel. Женские истории

marsianin 11 авг 2023 в 16:50

Это увлечение diversity заканчивается тем, что главную эйчарку назначают руководить DCAI: https://www.intel.com/content/www/us/en/newsroom/biographies/biography-sandra-l-rivera.html

Посмотреть

Об одной мета-оптимизации

marsianin 10 авг 2023 в 16:05

Может иметь значение на тяжёлых enterprise приложениях, когда icache/itlb миссы отъедают значительную часть времени.

Возможно, ошибаюсь, но мне всегда казалось, что icache или itlb miss случится только если переход не предсказался, и при этом branch target далеко относительно инструкции перехода. Всё таки instruction fetch работает спекулятивно. Скорее это будет, на indirect call/jump, и с этим надо бороться девиртуализацией методов.

push/pop - две load/store операции с зависимостью

Если мне память не изменяет, то в том же golden cove сделали memory renaming как раз для такого. Но это только пытается порвать зависимость по данным, store и load всё равно выполняются, травят кэш и греют атмосферу.

Посмотреть

Немного об оптимизации кода путем «свертки»

marsianin 10 авг 2023 в 01:08

А теперь давайте считать, сколько обращений в память и арифметики требуют инструкции call и ret, как предсказываются переходы, и какое влияние всё это оказывает на исполнение кода. Нет, серьёзно, в Intel и AMD работают весьма грамотные инженеры, которые к тому же имеют доступ к деталям реализации процессоров. Так что платформоспецифичные оптимизации для x86 никто лучше них не реализует. Достаточно посмотреть, какой код генерируют GCC и llvm, для которых x86-специфичные вещи разработаны инженерами Intel, чтобы отпало всякое желание экспериментировать с 8 и 16-битной арифметикой, выравниванием, уплотнением кода, etc.

Посмотреть

Об одной мета-оптимизации

marsianin 10 авг 2023 в 00:22

Только в реальности процессор регистры переименовывает. Все эти rax-r15 в некотором роде виртуальные. В настоящем процессоре будет больше сотни регистров общего назначения. Что касается плотности кода, то больше 32 байт и 5 инструкций за такт всё равно не декодируется, поэтому слишком уж уплотнять тоже нет смысла.

Посмотреть

Реализуем с нуля функцию косинуса на языке C

marsianin 19 июн 2023 в 22:46

Почему-то у меня в документе написано другое: "Scalar floating-point SIMD instructions have lower latencies than equivalent x87 instructions. Scalar SIMD floating-point multiply instruction may be pipelined, while x87 multiply instruction is not. Although x87 supports transcendental instructions, software library implementation of transcendental function can be faster in many cases."

Посмотреть

Реализуем с нуля функцию косинуса на языке C

marsianin 19 июн 2023 в 18:41

SSE это ещё и скалярные операции. И прочитайте наконец интеловское руководство по оптимизации. Там чёрным по белому написано: не используйте инструкции x87 FPU, они медленные, и сохранены только для совместимости со старым софтом.

Посмотреть

Уволить за 60 секунд: что мешает нам увольнять людей вовремя

marsianin 27 мар 2023 в 17:27

А теперь расскажите, как уволить человека, если он не хочет увольняться сам. По сокращению? Проблемно, потом замену не нанять. По несоответствию занимаемой должности? Не оформить. По соглашению сторон? Так он не хочет. Или требует в соглашении каких-то неадекватных выплат.

Посмотреть

В условиях параллелизма обнуление памяти замедляется

marsianin 20 июл 2022 в 21:19

IOMMU не пишет в память. Оно только адреса транслирует

Посмотреть

Как защищать границы массива без команды BOUND

marsianin 23 июн 2022 в 07:27

Выбросить инструкцию BOUND было очевидно хорошим решением по двум причинам: (1) она реализуется неприлично длинной последовательностью микрокода и (2) компиляторы её не используют.

(1) легко заметить, если посмотреть на семантику. Как минимум, нужно две загрузки из памяти, два сравнения и условная генерация исключения. При этом, пользователь не может никак это оптимизировать, храня границы диапазона в регистрах. Плюс, генерация исключения сама по себе очень дорогая: сброс конвейера и туча обращений в память. Дешевле эту операцию сделать с помощью пары CMP и пары Jcc.

(2) в соответствии со стандартами языков C и C++, на которых пишут большинство критичного к производительности софта, выход за границы массива это неопределённое поведение. Соответственно, компилятор имеет право предполагать, что таких ситуаций в программе никогда не происходит. Следовательно, эти проверки просто не нужны. В частности, и GCC, и clang/llvm их вставляют только если очень хорошо попросить специальной опцией, и при этом часть оптимизаций идёт лесом.

Посмотреть

Принцип работы вечного двигателя

marsianin 3 июн 2022 в 00:32

Не получается из дурости извлечь полезную работу, так что увы (-:

Посмотреть

Принцип работы вечного двигателя

marsianin 2 июн 2022 в 19:57

Не получается. Квантовая механика не даёт бесконечно уменьшаться )-:

Посмотреть

Принцип работы вечного двигателя

marsianin 2 июн 2022 в 19:44

ТС просто описал своими словами вечный двигатель второго рода (-:

+11

Посмотреть

Принцип работы вечного двигателя

marsianin 2 июн 2022 в 19:39

Например, 10%, потерянные в нашем агрегате, он возвращает на вход и снова преобразует с той же эффективностью 90% (т.е. 9% от исходного).

Эта "рециркуляция" возможна только с совершением работы, то есть с затратами энергии. Иначе нарушается второе начало термодинамики.

+12

Посмотреть

Вычисляем на видеокартах. Технология OpenCL. Часть 1a. Как работает OpenCL

marsianin 30 сен 2021 в 00:50

В общем-то opencl ± жив. И SPIR-V в нём тоже поддерживается.

Посмотреть

OMF еще послужит

marsianin 8 сен 2021 в 20:05

Это очень похоже на модули из C++20

Посмотреть

OMF еще послужит

marsianin 8 сен 2021 в 15:24

Очевидно, никакие

Посмотреть

Зачем нужен регистр SPL

marsianin 28 авг 2021 в 06:41

Более того, архитектура x86 явно запрещает переупорядочивать операции чтения. То есть нельзя поменять местами два чтения или две записи. Можно только чтение и запись.

Посмотреть

Зачем нужен регистр SPL

marsianin 27 авг 2021 в 21:09

Всё-таки ABI, а не API

Посмотреть

2 3 ...

9 10