Pull to refresh

Comments 35

Первые тесты DTK с Apple A12Z показали, что в Geekbench v5 тестовый ARM-комплект показывает результаты на уровне Apple MacBook Air 2020 (Single-Core: 1064, Multi-Core: 2163).
Я правильно понимаю из того твита на французском, что это ещё и результаты x86-теста, запущенного в эмуляции Розеттой?
Да:
that these tests are running under virtualization, using Apple’s Rosetta technology, as the Geekbench testing software has not yet been optimised for Apple Silicon.

Так что похоже, переход на новую платформу может пройти очень быстро, раз уж даже на Розетте результаты вполне на уровне пусть и недорогого, но самого современного макбука.
И это ж еще процессор прошлогодний на новом устройстве.
Розетта ничего не эмулирует. Это нативный код, в который приложениме перекомпилируется при установке/первом запуске. Так что ожидать прямо чрезвычайно большой разницы скорее всего не стоит.
Эмулирует, если нужно.
Там несколько техник и статическая трансляция — лишь одна из них.
Rosetta can translate most Intel-based apps, including apps that contain just-in-time (JIT) compilers.

Одна из проблем трансляции х86 на ARM это реализация принятых на х86 правил упорядочивания обращений к памяти.
ARM-ы это weak ordering. x86 — strong ordering.

30% это довольно большая разница с нативом,
С другой стороны 70% от натива это очень круто для бинарной трансляции.
И? Мне это прекрасно известно. В данном случае должна сработать рекомпиляция при запуске. Непонятно кто и зачем мне минус поставил, когда я всего лишь описал принцип розетты в данном случае. Мне сложно назвать эмуляцией статическую рекомпиляцию, которая потом использует все нативные интерфейсы ОС, которое использовало и изначальное приложение. Даже с учетом модели памяти — скорее всего достаточно расставить где нужно барьеры. Если в самом процессоре как бы не было режима работы с специального для этого.
когда я всего лишь описал принцип розетты в данном случае

Вы утверждали что «Розетта ничего не эмулирует». Про «данный случай» речь не шла.
Проблема в том, что вы не можете утверждать что программа полностью статически откомпилирована пока не посмотрели лог рекомпилятора.
Полная статическая рекомпиляция — непростая задача. Вы реверсили софт, скажем, в IDA?

Если в самом процессоре как бы не было режима работы с специального для этого.

Зачем бы ему там быть? Этот процессор не предназначен для маков.
Так и указано на сайте Apple:
«Если исполняемый файл содержит только инструкции Intel, macOS автоматически запускает Rosetta и начинает процесс перевода. Когда перевод заканчивается, система запускает переведенный исполняемый файл вместо оригинала. Однако процесс перевода занимает время, поэтому пользователи могут почувствовать, что переведенные приложения запускаются или работают медленнее в разы.»

Также есть уточнение:
Rosetta может переводить большинство приложений на базе Intel, включая приложения, содержащие компиляторы JIT. Однако Rosetta не переводит следующие исполняемые файлы:
  • Расширения ядра
  • Приложения виртуальной машины, которые виртуализируют компьютерные платформы x86_64


(by Google Translate)
И еще некоторые наборы инструкций, не транслирует.

Интересно, что увидим в качестве замены Ксенона в актуальных МакПро?

UFO just landed and posted this here
Все тоже самое, только больше ядер. По серверам и суперкомпьютерам уже видно, что армы с кучей ядер вполне шустрые и работают. Тем более к тому моменту эпл экосистема привыкнет к новой архитектуре. Новый макпро будет еще нескоро.

Я же не путаю, что сейчас 4 энергоэффективных и четыре производительных ядра?

Все правильно. А при чем тут это?

Ну, вы сказали про «больше ядер», только вот в контексте производительности стоит ли кивать в сторону «энергоэффективных ядер»?

Чтобы эпл сделать аналог ксеона ей достаточно будет нарастить число производительных ядер. Для рынка, где находится макпро, это будет работать. Понятное дело, что для этого ей скорее всего придется придумать хитрый интерконнект между этими ядрами и много чего еще над чем поработать, но у эпл достаточно примеров для подражания и умных инженеров, чтобы что-то сообразить. Нужны ли будут тут слабые ядра вопрос сложный, может и не будет смысла на них тратить транзисторы. Не тот продукт и рынок.

Так вот и я о чем! Сейчас серверные АРМ — это эксперимент ради снижения энергопотребления. Тем, кто покупает Мак Про нужна производительность, а не энергоэффективность (Ксеон — это не про экономию энергии). Что они сделали в тестовом ките? Дали iPad’овский проц, с ещё одним разблокированным ядром, как я помню. Такой фокус с МакПро не пройдёт. Вот мне и интересно, будет ли маленькая революция в плане производительности от а14.

Производительность без энергоэффективности — получаем в результате что-то вроде DGX Workstation от Nvidia. Тихая и производительная — но сидеть рядом с ней еще то удовольствие, греется как утюг.
Производительность без энергоэффективности

Так там высокая производительность именно из-за высокой энергоэффективности.
Nvidia не стесняется в выражениях: GV100 is an extremely power-efficient processor.

GV100 — 7.8TFlops / 300W = 26 GFlop/Watt.
В реальных системах из top500 всё более скромно — Power+GV100 — 14 GFlop/Watt.
У Fujitsu ARM — 14-16.
У Intel — ~5.

греется как утюг

Греться система может хоть как ядерный реактор, но от этого она не перестанет быть энергоэффективной. Хоть она 1W потребляет, хоть мегаватт — важно соотношение.
Сейчас серверные АРМ — это эксперимент ради снижения энергопотребления

Дорогой «эксперимент». Один Fugaku имел бюджет в $910M.

нужна производительность, а не энергоэффективность

Сейчас, когда серверные процы упираются исключительно в энергопотребление, это практически одно и то же.
Не думали, почему EPYC 7742 64-ядерный имеет базовую частоту в 2.25ГГц/3.4 turbo? Просто достаточно и пары десятков ядер на частоте 4.5 ГГц чтобы упереться в TDP 225W.
80-ядерный Ampere Altra имеет 80-ядер и частоту 3.3ГГц (sustained turbo).
Хотя ядра там, по нынешним меркам, слабенькие — 1 поток Zen2 против одного ядра N1 (на одной частоте), 128-ядерный Altra MAX (семплинг которого начинается в конце года) должен порвать любой существующий серверный х86 процессор по «целочисленной» производительности.
Если брать HPC, A64FX показывает>3TFlops в FP64, примерно столько же ожидается и у 96-ядерного Thunder X3.
Так что лучшие х86 уже проигрывают по производительности.

Дали iPad’овский проц, с ещё одним разблокированным ядром, как я помню.

GPU ядром.

Такой фокус с МакПро не пройдёт.

Этот проц не пойдёт ни в какой новый Мак.
Его поставили, потому что другого не было и он больше подходит для девкита чем телефонный — больше памяти, выше TDP и ПСП для работы с экранами высокого разрешения.

На лонче будет 12-ядерный процессор — 8 больших ядер и 4 маленьких.
Есть подозрение что много маленьких ядер выйдут примерно на то же потребление сколько потребляют большие с такой же производительностью. И скорее всего, примерно так и будет.
Ознакомиться с результатами SPEC2006 для этого проца можно здесь
www.anandtech.com/show/13661/the-2018-apple-ipad-pro-11-inch-review/4
Процессорная часть A12Z аналогична A12X.

Только вот Apple запрещает публиковать результаты тестов для DTK.
А так-то под macOS можно и 2017-й собрать (нужно 16GB для полного теста).
UFO just landed and posted this here
Так это у Эпл такие быстрые ARM-ядра. У остальных помедленнее. Притом, не такие уж дешёвые.
Близятся. Ampere вон все пилят свои процы, которые вполне на равных тягаются с эпиками по их заявлениям. А так, есть гравитон, есть A64FX, правда простым смертным он наверное недоступен. Все не настолько радужно, как пели в самом начале о полном перевороте в индустрии, но вполне себе работают. Просто явно мало кому оно надо. Люди с трудом на x86 от амд то перелезают, а тут вообще другая архитектура. Стабильность дороже.
UFO just landed and posted this here
Как и всё в СШП — баксовое лобби побеждает здравый смысл. Хм… сказал, а самому в голову тут же прилетели наши беспонтовые тендеры Российские. Я вот о чём задумался, сколько мзды попросит Мелкософт от Интела, чтобы не последовать за Яблоком? Ведь то что эпл сейчас делает, уже по сути реализовано в нескольких ноутбуках на топовых снапдрагонах. Но работать на них без перекомпилированной винды под АРМ практически невозможно, режим эмуляции х86 это выворот наизнанку.
У Майкрософта нет сильных мотивов уходить на АРМ:
1. Она не производит ни процессоры, ни потребительских устройств — нет финансовых мотивов, нет проблем с релизным циклом Интела (который так мучал Эппл)
2. Нет миллиона приложений под Windows На ARM (у Эплла есть миллион приложений которые можно будет запустить на армовом ноуте)
3. Нет огромного сообщества разработчиков, знакомых с программированием на их АРМ под Windows
Мотив Майкрософт заключается в том, чтобы компьютеры с Ўиндоўс не стали существенно медленнее и дороже, чем Маки.
Ну, того что Эппл начнет продавать ноутбуки дешевле других производителей можно точно не бояться :)
Эппл в низкобюджетный сегмент не пойдёт скорее всего. Но вот в среднем и в высоком может сложиться именно такая ситуация, если Майкрософт будет тупить.
>Но вот в среднем и в высоком

А у нас пока нет прецедентов АРМ-ов мощностью тянущих «средний и высокий». То, что показала эппл — это конкуренция entry level: MacBook Air, MacBook Pro 13.
Ну MacBook Air и MacBook Pro 13 — это явно не низкобюджетный сегмент.

Если бы в Эппл не были уверены, что смогут поднять производительность процессоров в условиях TDP Маков, то они бы и не меняли архитектуру, как они до этого её не меняли.
Автор опять наступил на «грабли» отсутствия знаний архитектуры ARM — много разных ядер («быстых», «средних», «энергоэффективных» ) не МОГУТ работать одновременно!!! Такова особенность архитектуры — вот тут и есть конек Intel и AMD — они смогли сделать на нормальном проце систему управления энергопотреблением, а АRМ просто переключает ядра — вот и получается 8-10-12 и т.д. колесный велосипед. Поэтому говорить а 8-10-12… ядерных энергоэффективных АRМ процах — надо с пониманием того, сколько реально в нем производительных ядер присутствует — и вот они то и будут править оркестром.

Вообще-то могут: https://en.wikipedia.org/wiki/ARM_big.LITTLE#Heterogeneous_multi-processing_(global_task_scheduling)


Это просто не используется для Rosetta 2 из-за усложнения обеспечения более строгой модели памяти x86 в присутствии разных типов ядер.

Оказалось, что этот DTK за $500 как минимум не уступает Apple MacBook Air 2020 с процессором Intel Core i3-1000NG4 за $999.


Но ведь для DTK это ничтожно мало?
Sign up to leave a comment.

Other news