Открыть список
Как стать автором
Обновить

Ampere Altra — первый в мире 80-ядерный ARM-процессор

Блог компании Дата-центр «Миран»Серверное администрированиеПроизводство и разработка электроникиКомпьютерное железоПроцессоры
Всего голосов 21: ↑21 и ↓0 +21
Просмотры21.9K
Комментарии 42

Комментарии 42

Самое важное сейчас то, что если вы посмотрите на все уровни, уровень ОС, все — от Linux до BSD и Windows — все поддерживают ARM, — говорит Джефф Виттич (Jeff Wittich), старший вице-президент по продуктам Ampere. — По виртуализации у нас есть поддержка Kubernetes, Docker, VMware и KBM
Чую недоговоренности здесь я.
Особенно после ограничения действия лицензии VMware на 32 ядра. 80 ядер = 3 лицензии, сэкономили на железе — заплатите за софт?
PS Интересно, они с Nvidia за торговую марку не судятся?
Пока на общих задачах ARMv8 сильно проигрывает x64.
Лучше взять 2 ядра на x64, чем 4 ARM (тем более у хостеров они близки по стоимости).
В смысле компиляторы не оптимальный код для ARM дают? Так это действительно пока. Будет спрос — компиляторы докрутят.
А причем тут компиляторы? Я думаю они вполне все там оптимально делают.
До оптимума в компиляторах для новых архитектур и процессоров и работать и работать.

Даже AMD периодически попрекает тестеров использованием компиляторов оптимизированных под Intel. Как только докручивают компиляцию, производительность вдруг вырастает.
С чего бы это? :)

Для Эльбрусов это вообще горящая тема. Только на доработке компиляторов они растут в производительности на 10-20% в год без всяких аппаратных обновлений. Из имеющихся 50 операций на такт, нанешним компиляторам удаётся выжать максимум 6. Запас по пиковой недоиспользуемой производительности почти 800%.

У серверных ARM конечно всё лучше с ресурсами на софт обстоит, но до компиляторов Intel им ещё далеко. Сегодня поэтому «на общих задачах ARMv8 сильно проигрывает x64.»
До оптимума в компиляторах для новых архитектур и процессоров и работать и работать.
arm ведь не шибко новая архитектура? По крайней мере сейчас все мобилки на них

Что касается Android, большая часть мофта выполняется в виртуальных машинах, а ближе к железу пишет в основном Google.

У ARMов по производительности тоже не все однозначно: Redmi Note 5 pro с Qualcomm Snapdragon 636 — 8 ядер на частоте 1.8 GHz и Xiaomi Redmi 6 с Mediatek Helio P22 — 8 ядер на частоте 2 GHz показывают в octane 2 соответственно 7253 и 4115, PC I7 4 ядра 3,4 GHz — Octane Score: 21837.

И армовые, и x86 ядра бывают очень разные. Можете сравнить ядра Kentsfield и Zen 2 на равных частотах, и посмотреть, что получится.

PC I7 4 ядра 3,4 GHz — Octane Score: 21837.
Это старьё какое-то. Но в любом случае вы сравниваете i7 с low-end/mid телефонными чипами.
В SD636 «большие» ядра это ни что иное как Cortex-A73, который декодирует лишь 2 инструкции за такт.

Apple A13 2,66GHz — 49137 баллов
Ryzen 3950X ~4,3GHz — 52487 балла

(но нужно учитывать то, что ОС и браузер разные)
ARMv8 это архитектура.
Какие конкретные процессоры вы имеете в виду?
2 ядра Neoverse N1, которые использованы в данном процессоре, лучше чем 1 ядро Skylake (и его клоны)
ARMv8 это архитектура.

Спасибо, кэп.
Как бы и x64 даже не архитектура.
Так что сравниваем сферических коней в вакууме…
а по поводу
2 ядра Neoverse N1

пробовал на AWS — все равно 2 ядра m6g.large показались медленнее чем m5.large))
Но это чисто ИМХО, так как тесты не проводил.

Ссылку на найденные гуглопоиском тесты дал в комментарии ниже.
Так что сравниваем сферических коней в вакууме…

Вы сравниваете, не я.
Архитектура не имеет производительности. Это формальное описание системы команд и протоколов.

Ссылку на найденные гуглопоиском тесты

Разберитесь, что за результаты вы приводите.
По ссылке Amazon-овские х86 инстансы сравниваются с ARM инстансами Scaleway.
Powered by up to 64 Cavium ThunderX 64-bit vCPUs and DDR4 ECC RAM.
Первый ThunderX это довольно тормозной процессор, примерно как Cortex-A53 (по производительности на ядро), который используется в самых дешевых телефонах.
К m6g, Graviton2 и ядрам A76(N1), которые используются в Altra, данные результаты не имеют никакого отношения.

Вот вам сравнение m6g и m5:
docs.keydb.dev/blog/2020/03/02/blog-post

Как может x64, исполняющийся на RISK через микрокод, выигрывать у RISK без лишней прослойки?

Не RISK, а RISC.
х64 процессоры не выполняют RISC код. Это упрощение, которое не соответствует действительности.
В вашей логике непонятно, что же соответствует действительности. Уже сама действительность под сомнением )
WAT?
Действительность соответствует действительности. CISC-овые микрооперации (loadop и rmw) нынче не разбиваются на RISC-подобные. Опять же, микрокод нужен лишь для сложных операций/редких случаев. Обычные операции обходятся без него.

Уже сама действительность под сомнением

Что-то забористое.
Берете у одного хостера 2 одинаковых инстанса и гоняете на них, ну например MySQL workbench. или вот тестили ссылка
Верю. Но то, что RISC эффективнее CISC, давно доказали мобильные телефоны, которые потребляют в разы меньше, но при этом делают выполняют довольно сложные задачи, и даже пытаются соревноваться с десктопными процессорами.

Вот и интересно — в чем же дело?
RISC эффективнее CISC, давно доказали мобильные телефоны
извините, но это из серии что, мягкое доказало, что оно более полезнее чем теплое.
А практика на серверном рынке показала, что сейчас CISC имеет лучшие потребительские свойства чем RISC. (долю PowerPC и SPARC надеюсь знаете?)
Сравнивать абстрактные RISC и CISC бессмысленно.
Сравнивать нужно конкретные модели и их производительность, TCO, доступность софта.
x86 был дешевле и широко доступен для разработчиков в своё время, это позволило вытеснить большие RISC-и, несмотря на более низкую производительность. Сейчас производители ARM систем старается повторить этот трюк. Всё больше софта и ОС поддерживаются на ARM. Linux/Windows установить — не вопрос. В плане производительности стоковых ядер ARM, выходящий в этом году Cortex-A78 обещает быть вполне на уровне современных чипов Интел/AMD.

Power остался только в суперкомпьютерах и мейнфреймах. Sparc уже мёртв.
Сейчас ARM будет рулить и в Top500.
Эм, тогда почему arm активно завоевывает серверный рынок?
Есть ноды в амазоне. Японцы строят свой будущий суперкомпьютер на них. Количество производителей начинает активно расти?

Я понимаю, что за десять лет обещаний от АРМ прорваться на рынок — новости кажутся постными. Но за последние пару лет виден явный прогресс и доступность простым смертным.

Я уже молчу, что ddr5 сейчас можно купить только в телефоне. По слухам на 95% в этом году x86 не получит новую память, только в 2021. Аналогично с hbm
Как-то было сообщение, что на iphone (то есть ARM) SMT-солвер Z3 работает заметно быстрее, чем на интеловском десктопе. Правда внятных объяснений почемк так получается не было. А на этих ARM такие программы на сколько быстро работают? Это, конечно, не модный машинленинг, но все равно задача полезная.
Вот именно такую мысль статья порождает :)
Где сравнения с однокровником?
Где сопоставление с похожими Fujitsu A64FX и Эльбрус-8СВ?
У них похожие стартовые позиции – неразвитость компиляторов и опыта в эксплуатации.
ну да, амазон не предлагает нод на арме

Предлагает. A1 инстансы и они стоят в два раза дешевле.

Только А1 и медленнее раза в три. Так что, брать их можно только для тренировок.
А вот M6g нужно пробовать. Возможно они и правда хороши.

Простите, забыл добавить тег сарказма.

Очевидно что за последние 5 лет АРМ успешно попали в серверный рынок. То что нет каких-то крыше сносящих продуктов, которые работают только на арм серверах — еще не показатель.
45?210 Вт — что это за TDP? Опечатка?
45-210 т.к. будет не одна модель, а несколько, c разным количеством ядер.
А может это указан именно минимум-максимум для 80-ядерного в режиме простоя/нагрузки?
TDP это не энергопотребление, а требование к системе охлаждения, которая должна быть способна отвести указанное количество тепла. Минимальная граница попросту не имеет смысла.

На Anandtech явно написано:
The CPU range will vary from 45W to 210W, and vary in core count — we suspect these SKUs will be derived from the single silicon design, and it will depend on demand as well as binning as to what comes out of the fabs. Exact SKUs are going to be announced later this year.

Это большой кристалл, поэтому будет много чипов с битыми ядрами. Логично их выпускать с меньшим количеством ядер подешевле.
Просто автор уже исправил 45?210 Вт на 45-210 Вт )))
Забавно. AMD сделали проц мощнее Intel
специалисты прогнозируют, что платформа ARM составит конкуренцию x86 в дата-центрах, но этого никак не происходит.
А вот проц, который мощнее AMD примерно на те же проценты, и
Всё это указывает на то, что процессоры RISC могут найти применение не только в мобильных устройствах, но и в серверах
но этого никак не происходит.
Ага, никак. С нуля до 4,5 процентов на старых поколениях, куча новых суперов на АМД уже собирается и анонсируются даже на Zen4.
А вот проц, который мощнее AMD примерно на те же проценты
Хм, АМД сделала процы, которые мощнее Интела в разы (за счёт ядер). Тут 4% если умножить производительность АМД на 0,85 в целочисленном тесте. Вы точно ресурс хабр с хоботом не спутали? Обычно там подобные комменты оставляются в массе.
Ага, никак. С нуля до 4,5 процентов на старых поколениях, куча новых суперов на АМД уже собирается и анонсируются даже на Zen4.
А вы вообще кому отвечаете? «но этого никак не происходит.» это цитата из статьи.
АМД сделала процы, которые мощнее Интела в разы
Открыл тесты Где разы? Опережение в 2 раза есть только по памяти, в остальных проигрывает одному из интелов. Или вот. Где тут разы?

картинка из статьи
image
Написано: Altra быстрее AMD на 13% на стойку.
Так же как и процы амд над интел в приведенных тестах.

Интересно, с чем вы спутали хабр.
Открыл тесты Где разы? Опережение в 2 раза есть только по памяти, в остальных проигрывает одному из интелов. Или вот. Где тут разы?
Вы б ещё тесты позапрошлого века поискали, а то чего только 17-го года? Надо найти сравнение вообще бульдозеров каких — вот там же вы победите!
Вообще-то раз разговор про серверы, то сравнивать надо новое поколение с кучей ядер (пусть по ссылке и не серверные, но там разницы считай нет), которое уже полгода как было представлено и к январю на котором серверы стали предлагаться активно. Сами найдёте количество ядер и производительность оных? Может графики посмотрите в статье?
Ах да, вы ж умеете сравнивать только топ Интела против не топа АМД можете и в игорьках? Что ж вы против i9-9900K (который в игорьках не лучше i7-9700K, особенно если вспомнить, что потоки интела сильно уязвимы настолько, что производитель сам рекомендовал их отключать?) привели 3700X, а не 3950X? Прям по методичкам хобота, откуда, такое ощущение, и набрались аргументов.
Написано: Altra быстрее AMD на 13% на стойку.
Неа, там написано:
Однако в сравнении производительности Ampere применила к результатам AMD коэффициент 0,85
Открыл тесты Где разы? Опережение в 2 раза есть только по памяти, в остальных проигрывает одному из интелов. Или вот. Где тут разы?
первая ссылка от 2017 года, а во второй… жесть. Во-первых, сравнение 3700x против 9900k где первый на треть дешевле, во-вторых присмотритесь к шкалам/цифрам (АМД побеждает в половине тестов), а в третьих сравнивать разные процы на одних частотах в принципе некорректно. Тем более что автор бенчил на двух плашках и одинаково настроил для разных процов.

«В разы» было про результаты из этой статьи, про Threadripper 3990X.
Что у них с выполнением 32х битного ARM кода?
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.