m1rko 2 дек 2020 в 18:29

Компиляция C/C++ на Apple M1

4 мин

49K

C++*Компиляторы*C*Разработка под macOS*Процессоры

Перевод

+79

163

Комментарии 163

HerrDirektor 2 дек 2020 в 18:48

Впечатляет. Никогда не любил яблочную технику, но нужно признать, что М1 у них получился очень хорошим, даже если уполовинить восторженные отзывы и синтетические бенчи. Подумываю купить себе для опытов.

Wendor 3 дек 2020 в 05:05

Соглашусь. Я крайне не люблю Apple за их ценовую политику, за то что они пользователям не оставляют выбора и т.д., но как бы я не противился, не могу отрцать их вклад в современный мир. iPod, iPhone, iPad а теперь и Маки + сопутствующие им технологии. Причем не столько в сами технологии, сколько в их реализации. Хочется верить что и с ARM у них все получится и в конечном итоге у нас будет тьма производителей процов и дешевые цены на них, ну и бонусы с энергоэффективностью тоже будут плюсом. :-)

Zverienish 3 дек 2020 в 15:06

Ценовую политику. Ну вот ноуты и стоят так же как ультра буки у других, какие-нибудь леново thinkpad-ы так и дороже обойдутся при худшем экране и таче и процессоре. Телефоны по ценам так же как и самсунги и не намного других обгоняют. Тут уже сяоми почти подтянулся. Планшеты со стилусом не прошные, так вообще фактически вне конкуренции. Поэтому вот говорить что просто дорого, то сравнивать надо с товаром такой же категории, а не с Асером на селероне и эраном 1280 на 720 за 20 т.р.

Wendor 3 дек 2020 в 18:32

Ради интереса зашел и потыкался:
— iPad Pro — 146k
— MacBook 16" — 665k
— iMac Pro — 1,4kk
— Mac Pro — 5,4kk

-4

Zverienish 3 дек 2020 в 18:35

И?

Makbook Pro 13
Чип Apple M1 с 8‑ядерным процессором, 8‑ядерным графическим процессором и 16‑ядерной системой Neural Engine
8 ГБ объединённой памяти
SSD‑накопитель 256 ГБ¹
Дисплей Retina 13 дюймов с технологией True Tone
Клавиатура Magic Keyboard
Touch Bar и Touch ID
Трекпад Force Touch
Два порта Thunderbolt/USB 4
Экран 2560×1600 Яркость 500 кд/м²
129 990.00 pyб.

Lenovo ThinkPad X1 Carbon
Дисплей: 14" IPS 1920x1080 FHD; 400 нит
Процессор: Intel Core i5 i5-10210U 1.60 ГГц;
Видеокарта: Intel UHD Graphics;
Оперативная память: 8 Гб LPDDR3;
Накопитель: SSD 256 Гб;
145 590 руб.

Плюс к этому у макбука лучше экран по яркости и цветопередаче и лучше звук. Ну и плюсом дольше работает. И в общем леново медленней заметно будет с i5.

Wendor 3 дек 2020 в 19:02

Можно я не буду продолжать спор? Вы же понимаете что в цену нового Makbook Pro 13 легко находится аналог, превосходящий по: разрешению, памяти, объему диска и с настоящей видюхой? К примеру, Huawei Matebook X Pro MACHC-WAE9LP.

Раз вы считаете что цены «ок» — дело ваше. Мое мнение немного выше в ветке. Люди мы взрослые, выводы строим каждый для себя сам, опираясь на свой субъективный анализ имеющихся у нас фактов. А истины не существует. Добра вам. :-)

olegi 3 дек 2020 в 20:09

UPD 03.08.2020: ThrottleStop не работает в последних обновлениях BIOS, в режиме максимальной производительности температура улетает вверх и можно кипятить чайник. Ограничил частоты стандартными средствами винды до 2,9ГГц, выбрал режим оптимальной производительности, температура в норме.

UPD 03.09.2020: откатил BIOS до 1.05, с ним ThrottleStop работает и проблем с нагревом больше не наблюдается.

UPD 13.11.2020: клавиатура стирается при интенсивной печати, т.е. становится глянцевой в местах соприкосновения с пальцами. Заметил это спустя месяц использования, мог бы списать это на особенности моих рук или манеру набора текста, но увы, с таким неприятным недостатком столкнулся не только я.

Второй ноутбук за 2 месяца требует ремонта, а скорее всего замены… Первый ноутбук бы куплен новым по приезде домой, после начала работы при нажатии на клавиатуру, начал издавать весьма сильные скрипы и трески с правой стороны, как будто играет задняя крышка или что-то под ней, естественно крутить болты на только купленном гарантийном ноуте не хотелось от слова совсем, да и была надежда, что достаточно дорогой ноут крупнейший сетевой магазин электроники поменяет сразу, но нет — радостно сообщили, что берут на 21 на «проверку качества»!

Купил бы я его, если бы знал все что знаю теперь? Наверное нет.

Antervis 3 дек 2020 в 20:20

Можно я не буду продолжать спор? Вы же понимаете что в цену нового Makbook Pro 13 легко находится аналог, превосходящий по: разрешению, памяти, объему диска и с настоящей видюхой? К примеру, Huawei Matebook X Pro MACHC-WAE9LP

Это MX250 то настоящая видюха? Её интегрированная в M1 обходит. А еще в matebook'e intel 10-ого поколения, LPDDR3 память на 2133 МГц вместо LPDDR4X на 4266, ну и дальше по мелочи. В общем, достойного конкурента не так уж и легко найти. А если учитывать такие параметры как качество тачпада и живучести от батарейки, то едва ли вообще возможно. И, имо, среди M1 макбуков лучше взять air — перф различается несущественно, батарейка тоже, а тачбар этой дельты точно не стоит.

Isaac_ods 9 дек 2020 в 16:28

Пишут вот что про ноуты с m1: «яркость дисплея MacBook Pro может достигать 500 нит, тогда как у MacBook Air – 400 нит». Я думаю, если человек любит в теплое время года на веранде дома работать днём, то яркость решает.
При этом у прошки «студийный микрофон и динамики», что бы это не значило, а у эйра обычные.

szt_1980 31 дек 2020 в 01:45

Несущественно — это пока до 100 градусов не прогреется

Antervis 31 дек 2020 в 02:34

так он прогревается несколько минут

ivatsy 5 дек 2020 в 20:05

В макбуках цветовой охват приближается к P3, даже в новом Air. Попробуйте найти такой в других производителей меньше чем за 2500$

Bismuth208 7 дек 2020 в 17:18

Можно я не буду продолжать спор? Вы же понимаете что в цену нового Makbook Pro 13 легко находится аналог, превосходящий по: разрешению, памяти, объему диска и с настоящей видюхой? К примеру, Huawei Matebook X Pro MACHC-WAE9LP.

А вот и нет!
Удачи Вам в этом, пишу Вам с Macbook Pro 13" Late 2013.
Несмотря на то, что моему старичку уже 7 лет и он на родном аккумуляторе, у которого 600 циклов, он до сих пор держит 5-6 часов (вместо 14 в начале)!
Более того, им вполне можно пользоваться в некоторых задачах!

Я честно искал замену все эти годы, но везде есть одно или более НО:
— 15" и FHD делают шрифты омерзительно ужасными;
— ужасное охлаждение и перегрев (да, в том числе MBP 16" это позор...);
— ужасный тачпад (ну вот ЗАЧЕМ ЧЕРТ ВОЗЬМИ ДЕЛАТЬ ЕГО ШЕРШАВЫМ !?);
— пластиковый корпус (есть же нормальный пластик, но нет, надо ж самый дешевый ABS !);
— проблемы с драйверами под ввоон ту сетевую карту, которая есть только тут;
— плохая подсветка клавиатуры;
— ужасно тугой механизм экрана или вовсе хлипкий;
— неравномерная подсветка экрана;
— зачастую бесполезное железо чисто для галочки (MX250, MAX-Q и прочее);
— bloatware (а если переставить систему, то проблема драйверов см. выше);
— ужасная автономность (ага только часа 4-5 пока новый);

Итак, подитожим что мы имеем в маках и их цене:
— стоимость их сервисов (синхронизация заметок и прочего через облако);
— бесплатные обновления ПО ОС (которые редко что-либо ломают, но есть же TimeMachine ?);
— превосходный экран с вменяемым разрешением для ТЕКСТА;
— нормальный корпус из приятного материала;
— вменяемую автономность;
— и прочие антиминусы win-ноутбуков;

Вот, ЭТО стоит ~210К!!!
Сдувается от перегрева или без зарядки почти сразу.
Вот Вам некоторое доказательство.
И где Ваше дешевле и лучше?
Ну вот где !?
Могу предположить, если бы оно и было, то было бы оно везде, на каждом сайте и в каждой новости… ой… так именно это и произошло с M1!

Уже заказал себе это Air чудо на M1 с 16Gb опцией.

Пожалуйста, быть может уже настало время выкинуть методичку, где написано что «Aplle это дорого» и взглянуть на мир чуть иначе более… ммм… досконально, не ?

P.S.
И да… припекло…

Antervis 7 дек 2020 в 18:07

Вот, ЭТО стоит ~210К!!!
Сдувается от перегрева или без зарядки почти сразу.
Вот Вам некоторое доказательство.
И где Ваше дешевле и лучше?

в G14 хотя бы видюха неплохая, и в выбранном варианте 32 гига (хотя эту версию фиг найдешь), т.е. он хотя бы по некоторым параметрам существенно обходит M1 mac'и. А вот тот же dell xps вообще не выдерживает конкуренции, являясь ближайшим аналогом.

НЛО прилетело и опубликовало эту надпись здесь

aplekhanov 8 дек 2020 в 15:17

Так-то они с 1976-го вкладывают, Антош.

Zverienish 3 дек 2020 в 15:00

А в чем интересно не любовь.

aplekhanov 8 дек 2020 в 15:04

Не забываем про два ключевых момента:
1) М1 это SoC, а не просто CPU, где-то видел про прирост в тенсорфлоу 7х
2) это не железо в вакууме, а как говорили раньше: программно-аппаратный комплекс. Про работу винды на арме сами знаете, как сейчас обстоят дела.

Все по заветам покойного: «People who are really serious about software should make their own hardware.»

HerrDirektor 8 дек 2020 в 19:28

Судя по тому, что винду таки запустили на М1 (через QEMU правда) и на нём она показала двукратное(!) быстродействие по сравнению с родным Surface… В общем, я всё больше хочу эту железку в коллекцию. Но ещё не решил — ждать М1Х или просто купить макмини на младшем процессоре.

khajiit 8 дек 2020 в 21:38

Подождать, пока выйдет вторая версия камня)
Ну и M$ может разговлеется, и сделает-таки нормальные лицензии для arm.

localkost 2 дек 2020 в 19:03

Очень достойная производительность. Вы случайно не занимаетесь работой с контроллерами!? Очень хочется узнать возможность установки драйверов программаторов для популярных чипов от Microchip и ST.

wigneddoom 2 дек 2020 в 19:19

Я занимался. В основном всё Win-only. Некоторые, TI, даже сделали под Linux. Это убогое нечто.

ST молодцы, 90% их чипов можно программировать/отлаживать в любой ОС на любом CPU.

Vadimatorikda 3 дек 2020 в 16:57

Потому что Java…

Gordon01 3 дек 2020 в 17:46

Потому что cortex-m и openocd.

wigneddoom 3 дек 2020 в 17:52

Java — ха-ха, упоротые из TI сумели сделать Eclipse(java) -> node(JS) -> сишная программа -> драйвер. В своё время насмотрелся на этих жопакул

Для себя принял следующие принципы: нет GCC и поддержки OpenOCD — микроконтроллёр идёт лесом.

Это ещё не считая откровенного вранья в даташитах, на сайте и т. д.

P.S. Это конечно моя личная ненависть к TI, уже четыре года не имел с ними дела, может что-то и изменилось к лучшему.

thatsme 2 дек 2020 в 19:52

Мне кажется, или после данной статьи, и вот этой новости, прения здесь можно прекратить?

Т.е. Apple будет паровозом маркетинга для своего продукта, и для всех кто в этот паровоз захочет запрыгнуть вместе со своими продуктами. Хайп будет…
Главное, чтобы среди всего, что с архитектурой ARM выпустят в десктопный рынок, было хотя-бы несколько продуктов без блобов. Вот они реально пойдут в массы.

Интересно, Google имея хромбучный опыт, в десктопы не ринется?

kulikovDenis 3 дек 2020 в 12:29

Похоронка интел, выписанная от VDSina.ru, не очень серьезная штука. Основное обвинение, что интел, стала большая и неповоротливая компания. Но здесь уже вопрос компетенции, автора. Интел двигает CPU+FPGA, а облачный провайдер, выписывающий похоронку IT гиганту, даже не знает о такой технологии. Выстрелит или нет, эта технология, вопрос открытый, но факт, интел все же берется за продвижение революционных технологии.
В общем, лично я приветствую технологическую гонку Intel vs AMD, x86 vs ARM vs RISC vs FPGA.

szt_1980 3 дек 2020 в 13:04

Это ерунда полнейшая, кстати. Аутсайдеры всегда видят большие корпорации только целиком, будучи не в курсе насчет того, как там внутри все устроено.

thatsme 3 дек 2020 в 13:11

На самом деле, я тоже не верю, что Intel сольётся. И x86_64 ещё пободается лет 15 за своё место под солнцем. Для меня главный посыл той статьи, — Apple вливает кучу бабла в маркетинг и продвижение десктопной платформы на ARM. И если к этому паровозу присоединятся другие гиганты отрасли, то мы возможно, получим ещё одну десктопную платформу (или несколько), на архитектуре отличной от x86_64. Будут разные лагеря и холивары, и жёсткая конкуренция, что выльется в:
1. Снижение цен на десктоп платформы и конкурирующие архитектуры
2. Гонку производительности, которая в конце-концов и в серверный сегмент перейдёт
3. Расширение экосистемы десктопов и соответственно рынка их обслуживания

НЛО прилетело и опубликовало эту надпись здесь

thatsme 3 дек 2020 в 16:16

Это худший вариант. А вот в коменте выше более реальный, что-то в духе анархии 90-х в мире ПК, с кучей производителей ПК, кучей проблем, холиваров, и т.д. Но главное, что это ведёт к естественной селекции и массовым продуктам.

НЛО прилетело и опубликовало эту надпись здесь

FreeNickname 3 дек 2020 в 21:49

На десктопах ситуацию всё-таки несколько иная. PC-энтузиасты не любят готовые компьютеры, по большей части.

НЛО прилетело и опубликовало эту надпись здесь

FreeNickname 4 дек 2020 в 02:28

Ну, тоже да) Собственно, я себе компьютер собрал, но когда потребовалось быстро купить компьютер деду – просто купил подходящий готовый.
Но всё же есть надежда на /r/pcmasterrace, что хоть на PC закрытыми архитектурами не закончится :)

НЛО прилетело и опубликовало эту надпись здесь

khajiit 3 дек 2020 в 17:41

Даже если и так, другие уже видели, что это возможно.
И сделали эти процессоры не высоколобые ученые в CERN'е, а обычная компания со всеми этими эффективными методологиями, стендапами и прочей ерундой.

Появление конкурентов теперь — вопрос времени. Скоро будет драка.

perfect_genius 4 дек 2020 в 20:23

И сделали эти процессоры не высоколобые ученые в CERN'е, а обычная компания

Где про это почитать?

khajiit 5 дек 2020 в 21:06

Эм. Вы сомневаетесь в том, какая фирма сделала Apple M1? ~~Роскосмос, конечно же.~~

Вообще, это жирный такой намек был на 10/40/100G оптику.

-1

perfect_genius 5 дек 2020 в 23:18

Я сомневаюсь, что его сделала "обычная компания". У неё столько ресурсов, что могли бы нанять кого угодно.

khajiit 5 дек 2020 в 23:51

Не боги горшки обжигают…

Закидать проблему деньгами работает только если проблема — исключительно в деньгах, а их, в свою очередь, некуда потратить.
А видите упоминание CERN? Вот это — пример необычной кампании, в корне отличающейся от топа, середины, низа и вообще любой части списка из обычных компаний.

-1

creker 6 дек 2020 в 00:26

За деньги можно купить специалистов и дать им ресурсы, что эпл и сделала. Эпл ни разу не обычная компания с учетом ресурсов. Как денежных, так и умственных.

khajiit 6 дек 2020 в 00:46

Этот опасается, что вы не в том видите необычность.

Zverienish 3 дек 2020 в 15:12

Похоронка не похоронка, но Интел сейчас прям зажата в тисках. Понятно что совместимость будет тянуть сильно в корпоративном сегменте особенно, но в остальной части будет прям сильно сокращаться. А CPU+FPGA, это все же узкий сегмент.

НЛО прилетело и опубликовало эту надпись здесь

Semenych 3 дек 2020 в 18:53

Я намерян до последнего цепляться за комфортную мне Intel/AMD, на которой например запускается много старого legacy. Но обоим руками приветствую усилия конкурентов. Это безусловно пойдет x86 на пользу.

V1tol 2 дек 2020 в 20:02

Читал недавно такую англоязычную статью: erik-engheim.medium.com/why-is-apples-m1-chip-so-fast-3262b158cba2, в которой упоминается, что в M1 засунули целых 8 декодеров инструкций. У Intel и AMD их всего 4 на ядро.

Tarik02 2 дек 2020 в 21:23

Но там же сказано, что больше смысла добавлять нет — их будет сложно нагрузить. Приходится угадывать где начинается следующая инструкция, добавление ещё одного декодера немного увеличит производительность ценой увеличения энергопотребления. ARM лишён данного недостатка — все команды выровнены и можно сразу начинать декодирования несколько. Да, поставили 8 декодеров. Intel/AMD могут с трудом поставить тоже 8, но с ARM можно поставить 16, потратив меньше усилий.

Я к тому, что это не так достижение Apple, как достижение RISC-архитектуры, а именно ARM. Даже если вы не любите Apple, их M1 подтолкнёт много разработчиков ARM-процессоров улучшать свои процессоры.

И к тому же, M1 достигает таких результатов при частоте 2.3 ГГц. И она такая малая не из-за каких-то концептуальных ограничений. Вовсе нет, это просто ограничение теплопакета. Если увеличить частоту и соответственно теплопакет, можно добиться лучших результатов.

lamerok 2 дек 2020 в 21:57

Но ведь x86 внутри тоже RISC.

Tarik02 2 дек 2020 в 22:00

Да, но он изнутри CISC. А его достаточно дорого (если хочешь быстро), или очень медленно (если хочешь дешево) парсить, чтобы заполнять буфер внутренних RISC-инструкций.

alkneu 3 дек 2020 в 00:04

Да, но он изнутри CISC

Может быть, всё-таки снаружи?

Tarik02 3 дек 2020 в 00:05

Да, именно. Извините, я не носитель русского.

+12

Zverienish 3 дек 2020 в 16:11

Декодировщики команд сложнее, не декодировав текущую команду не узнать где следующая. Плюс команды разбиваются на много мелких результат которых собирать надо в кучу.

szt_1980 10 дек 2020 в 02:03

— Предекодирование длины есть уже очень давно
— Декодеры большую часть времени ничего не делают
— Большинство команд порождают по 1 микроопу
— Есть такая вещь, как слияние микроопов

khajiit 2 дек 2020 в 23:50

8 декодеров на CISC имеют смысл разве что с SMT4.
Емнип, появление четвертого декодера как раз совпадает с возвращением HT и их (декодеров) удлинением.
А 2.3 — вполне логично. При двойном количестве EU и декодеров их можно загрузить той же работой на половинной частоте, сохранив производительность.

Antervis 3 дек 2020 в 05:44

И к тому же, M1 достигает таких результатов при частоте 2.3 ГГц

3.2* ГГц. Насколько мне известно, до 2.3 он не опускается даже при троттлинге в MBA.

Вовсе нет, это просто ограничение теплопакета

возможно чипы на 5нм техпроцессе нестабильны при заметно большей частоте.

Если увеличить частоту и соответственно теплопакет, можно добиться лучших результатов.

к сожалению, с ростом частоты нелинейно растут и энергопотребление, и производительность. Например из-за того, что задержки памяти не уменьшаются. Разогнав свои 3.2 ГГц в 5 они могли бы получить около 20% производительности, увеличив потребление в 4-5 раз. Ну, по крайней мере это примерно так работает в десктопах

creker 3 дек 2020 в 18:10

И она такая малая не из-за каких-то концептуальных ограничений.

И кто вам это сказал? У процессоров всегда есть вполне конкретные пределы частот, выше которых невозможно прыгнуть хоть ты с жидким азотом охлаждай. В том числе это зависит от типа выбранного техпроцесса, т.к. они тоже оптимизируются под скорость или энергопотребление.

AVI-crak 3 дек 2020 в 10:08

Декодер команд для arm предельно простой, потому как формат самих команд фиксированный.
Тут нужно на конвейер команд смотреть, он примерно одинаков для интела и arm на уровне простых операций логики и математики. Всё что уже могло быть сделано в параллельном виде — уже заоптимизированно по самые гланды. Интересны те самые небольшие отличия.

Осталось всего одно шаткое направление — триггерная логика. Это когда логика и математика выполняется асинхронно параллельными каскадами без внешнего клока — по фронтам триггеров завершения операции. Вещь сама по себе не подающаяся разгону, потому как уже работает на пределе кремния. Иии, пока ещё не реализованная, потому что сложно очень.
Чисто гипотетически, такой конвейер способен работать в десятки раз быстрее стандартного варианта. Ну это как серийный интел на эквивалентную частоту в 40ГГц. Почти как сказка.

Zverienish 3 дек 2020 в 16:07

Но армовские декодеры по идее проще должны быть чем под x86.

mithdradates 2 дек 2020 в 21:31

M1 это же фактически мобильный (в плане, что для ноутбуков и компактных станций вроде Mini) чип? Если так, то результаты впечатляющие. Интересно, выкатят ли что-нибудь для своих рабочих станций (в формфакторе ПК) или там тоже будут M1?

deseven 3 дек 2020 в 00:14

Ходят слухи о M1X, 12 ядер (8+4) и, возможно, более высокая частота, под 45W. Ожидается ли что-то еще более мощное пока неизвестно.

Mat1lda 3 дек 2020 в 16:09

Они пока упёрлись в то, что не смогли дискретную графику с м1 подружить. Ходит слух, что скоро выкатят ещё пачку обновлений на 32гб ram. (хотя мне не понятно то, почему они не выпустили MBP 16" на м1. (он бы наверное сутки работал от батареи)

esc 3 дек 2020 в 16:47

Ну вот наверное из-за проблем с дискретной графикой и не выпустили. + в макбутки наконец-то завезли больше 16Гб памяти, а тут опять забирать назад?

Должны же были оставить вариант для тех, кому нужна внешняя графика и/или больше 16 ОЗУ.

akaAzazello 2 дек 2020 в 23:28

А вы не пробовали прогнать тесты компиляции через Rosetta2/clang amd64? — (SPECint с того же anandtech показываает результаты от 49.87% до 94.73% — причём наихудшие как раз для gcc компилятора )

Antervis 3 дек 2020 в 06:44

а какой смысл гонять оптимизированное приложение через rosetta2? Результат компиляции же не меняется. Если вас интересует производителность конкретно rosetta2, то её тот же LTT оценил в «2/3 to 3/4 of full speed». Что, с учетом очень достойной одноядерной производительности, должно с лихвой хватать для всего непрофессионального даже через rosetta2. Например вот здесь демонстрируется разница в 2.4 раза в однопоточке против zephyrus G14 (ryzen 4900HS) при питании от батареи. Это сильно больше, чем штраф от rosetta2.

Для профессиональных задач лучше конечно же подождать M1X устройства. Или не лучше — надо смотреть по задачам. В любом случае опираться на производительность rosetta2 странно — рано или поздно подавляющее большинство приложений будет работать нативно, а если у вас вся работа в x86 и это не изменится в обозримом будущем, то какой смысл в ARM mac'е?

akaAzazello 3 дек 2020 в 10:18

Толку от вопроса не было, т.к. не заметил, что это опять перевод, несмотря на как минимум славянские имя/фамилию автора :(

А смысл вопроса был в том, чтобы понять, насколько такой mac целесообразно использовать для test/build-server для кросс-платформенной разработки — его габариты/экономичность/малый уровень шума очень хороши, но 49.97% для 502.gcc теста из Spec2017 делают это нецелессобразным, а вот 70.06% для 403.gcc из Spec2006 — вполне интересным.

НЛО прилетело и опубликовало эту надпись здесь

VioletGiraffe 3 дек 2020 в 00:53

Так это не дебют, это эволюционные наработки.
Лично я по тем тестам, которые читал, вижу паритет по производительности на ватт со свежими х86, что говорит о том, что обе архитектуры хорошо развиты и оптимизированы и в целом их потенциал схож.

-1

olegi 3 дек 2020 в 12:43

а где можно получить fan-less ультрабук с Ryzen 9 5950X?

VioletGiraffe 3 дек 2020 в 13:19

А зачем перекручивать? У 5950X TDP 105 W (а по факту, возможно, и больше), конурент М1 — Ryzen 4800U, который, насколько я помню, основан на ядре Zen 1, даже не 2 и тем более не 3. Это камень в огород АМД, у которых мобильные ЦП уже на два поколения отстают от десктопных, потому М1 на их фоне и выглядит хорошо. Но даже с ними у М1 в среднем паритет: www.anandtech.com/show/16252/mac-mini-apple-m1-tested/5

-1

Viknet 3 дек 2020 в 13:23

4800U — это Zen 2. Однопоточная производительность сильно ниже. По энергопотреблению далеко не паритет.

VioletGiraffe 3 дек 2020 в 15:36

Да, я ошибся с ядром. Насчёт остального — я привёл результаты тестирования anandetch, я им больше доверяю, чем какому-то чуваку с реддита с ноутбуком, о котором мы ничего не знаем (обновления UEFI, обновления ОС, настройки питания, не накосячил ли вендор с TDP или охлаждением). Однопоточная производительность по тестам тех же Anandtech действительно хороша, а вот многопоточная вполне наравне, особенно, если учесть, что формально у 4800U 15 Вт (не знаю, сколько по факту, это зависит от конкретного устройства, наверное), а у М1 >20 Вт.

-1

Viknet 3 дек 2020 в 16:00

Вот подменяете TDP и энергопотребление. На графиках подписан TDP, при этом замеров 4800u не делалось вообще.

Немного измерений его потребления есть у Anandtech тут и тут, но надо понимать, что каждое конечное устройство обладает профилями питания, которые могут как укладываться в TDP, так и серьёзно его превышать. Поэтому ориентироваться на него просто нельзя без измерений.

Формально у M1 нет объявленного TDP. Измерения потребления показывают от 15 Вт в Cinebench, до пика 21 Вт в одном тесте SPEC2006.

VioletGiraffe 3 дек 2020 в 20:23

Согласен, это тёмное пятно, которое требует дополнительных измерений. Измерения наверняка были в тесте этого ЦП, но я его не помню.

-1

Zverienish 3 дек 2020 в 16:22

на x86 там ТДП такое, толи средняя нагрузка, только чуть ли не стоичие. У i7-9xxx 45ВТ тдп, а под нагрузкой почти 70 жрет при том с тротлингом.

chupasaurus 3 дек 2020 в 16:44

Intel TDP указывает для нагрузок, не требующих буста, десктопные версии указанных вами камней и 200Вт умеют потреблять.

olegi 3 дек 2020 в 13:25

> У 5950X TDP 105 W (а по факту, возможно, и больше), конурент М1 — Ryzen 4800U

я ориентировался на эту статью — www.anandtech.com/show/16226/apple-silicon-m1-a14-deep-dive/4

> Но даже с ними у М1 в среднем паритет:
т.е. есть funless ультрабук с этим CPU?

Viknet 3 дек 2020 в 13:34

funless

Да много их.
(простите)

olegi 3 дек 2020 в 13:45

это как? :)

Viknet 3 дек 2020 в 13:46

Это когда покупаешь ноутбук, а фана от него никакого.

+10

olegi 3 дек 2020 в 14:01

принимаю :)

krab4yar 3 дек 2020 в 14:24

У ТСа mac mini он не fan-less если что. А fan-less версия macbook air имеет ниже частоты емнип. Но процессор действительно передовой получился да. Хочется посмотреть на ответы интоля.

Viknet 3 дек 2020 в 14:27

А fan-less версия macbook air имеет ниже частоты емнип.

Не, Air просто троттлиться начинает после 5-8 минут многопоточной или серьёзной гибридной CPU+GPU нагрузки.

olegi 3 дек 2020 в 14:28

в первых тестах у Ананда — ваще а14, из айфона :) и там он топ-чик

НЛО прилетело и опубликовало эту надпись здесь

Zverienish 3 дек 2020 в 16:25

Ответы Интоля несколько ле ждать придется, да и на архитектуре x86, возможно не получится сделать ответ. Да с тех процессом беда прям. 10нм уже на рынок выводят лет 5 минимум.

Antervis 3 дек 2020 в 13:38

Лично я по тем тестам, которые читал, вижу паритет по производительности на ватт со свежими х86

да ладно? Одно firestorm ядро M1 жрет чуть больше 6 Вт при полной нагрузке, а по перфу оно сравнимо с ядром ryzen 5xxx, которое выдавая подобный перф будет жрать около 20 Вт. А для энергоэффективности есть icestorm ядра. Intel кстати недавно объяснили как ryzen 4xxx достигают своей энергоэффективности. В двух словах — никак

-3

НЛО прилетело и опубликовало эту надпись здесь

Antervis 3 дек 2020 в 15:45

согласен, маркетологи интел играют грязно, и я знаю про критику конкретного заявления (например, они использовали только устройства lenovo и предвзятую выборку тестов). Однако для того же излюбленного вами zephyrus G14 с ryzen 4900HS тоже заметна значительная просадка — 1218/7923 от сети против 732/5449 от батареи, это более 30%. Что объективно подкрепляет аргумент intel. В то же время M1 маки молотят на полную и от батарейки.

Однако мой аргумент лишь в том, что оценивать производительность на ватт как «делим производительность от сети на автономное потребление» неправильно.

НЛО прилетело и опубликовало эту надпись здесь

VioletGiraffe 3 дек 2020 в 16:42

Посмотрите на график многопоточной мощности по вашей же ссылке, те же 5.5-6.5 Вт/ядро. Потом разделите многопоточную производительность любого Zen 3 c >= 4 ядер на суммарный фактический TDP, сделайте то же самое для М1, и покажите пальцем, где прорыв Apple. Не вижу я его в упор. Повторить результат конкурентов — это достижение, но не прорыв.

-1

Viknet 3 дек 2020 в 16:53

А почему бы не поделить многопоточную производительность при этих "5.5-6.5 Вт/ядро" на количество ядер, и не посмотреть, насколько она падает в сравнении с однопотоком при уменьшении потребления (~частоты)?

Мы фактически приходим к тому, что когда-то предсказывали для ARM: большое количество слабых ядер, чтобы обогнать несколько сильных.

UPD: Сам сходил посчитал для 5950X, и должен признать, что совсем несильно падает. Приятно удивлён и отзываю скептичный комментарий.

Antervis 3 дек 2020 в 18:20

Посмотрите на график многопоточной мощности по вашей же ссылке, те же 5.5-6.5 Вт/ядро.

вот только в этом режиме тот же 5950x будет работать на частоте не 4.8-4.9 ГГц (как в однопотоке), а на 3.9-4 ГГц. В то же время все ядра M1 будут работать на полную. Для других zen3 процов цифры приведены в той же статье, и они уже выше 7 ватт. Делаем то же самое для M1 — по ссылке выше берем 22.3 Вт из average MT workload (active power), делим на 4 ядра, получаем 5.6 Вт. И это без учета энергопотребления памяти ryzen'ов.

Zverienish 3 дек 2020 в 16:19

Ну уже последние года 2 производительность армов старших подтянулась к i5-i7 ноутбучным плотно. Да и начали Эпл разрабатывать компы на арме с 2017-2018 года что ли.

tzlom 3 дек 2020 в 01:21

я правильно понимаю что компилировалось под нативную архитектуру и это сравнение огурцов с яблоками?

fuermann 3 дек 2020 в 12:38

+ 1. Было-бы интересно сравнить результаты кросс-компиляции скажем в RISC V, на M1 и на Intel, так что бы и тот и другой делали реально одно и тоже.
Вполне может быть что под x86* оптимизация кода занимает куда больше времени компилятора, чем под M1. Это никак не приуменьшает выдающуюся производительность M1, но с точки зрения научной точности сравнение не вполне корректное вышло.

goldrobot 3 дек 2020 в 13:49

В статье четко сказано что компиляторы разные, а некоторые результаты лишь теоретическое предположение.

event1 3 дек 2020 в 18:46

Тот же вопрос возник. Если да, то компиляция под arm быстрее раза в два, примерно. Под x86 очень прошаренный оптимизатор. Для RISC-архитектур такой не нужен, через это — значительное сокращение времени компиляции

Maccimo 3 дек 2020 в 05:43

В отличие от процессоров Intel и AMD, которые используют отдельные кэши L2 меньшего объёма и большой, но более медленный общий кэш L3, в процессоре M1 реализован быстрый и большой общий кэш L2.

Раз пошла такая гонка, то AMD/Intel могут и увеличить L2. Что будет тогда?

maxzhurkin 3 дек 2020 в 07:50

Себестоимость вырастет

Maccimo 3 дек 2020 в 08:06

Это само собой.
Интресно было бы посмотреть на разницу в производительности c A1 при большом L2 у AMD/Intel. Будет ли она, насколько большая и в чью пользу.

maxzhurkin 3 дек 2020 в 11:39

Думается, что размеры кэшей выбираются далеко не только по транзисторному бюджету.
Например, берётся минимальный размер и сравнивается с удвоенным и учетверённым, если, условно, оба удвоения добавляют к производительности по 5%, используют максимальный или смотрят на другие ограничения, например, первое удвоение привело к росту себестоимости на те же 5%, а второе — уже на 13%, тогда чешут затылок

НЛО прилетело и опубликовало эту надпись здесь

maxzhurkin 3 дек 2020 в 17:30

Какое-то время первого, IMHO

НЛО прилетело и опубликовало эту надпись здесь

creker 3 дек 2020 в 18:02

Количество транзисторов значения не имеет. Важна площадь кристалла и стоимость технологии производства. Скорее всего эпловский чип дороже.

НЛО прилетело и опубликовало эту надпись здесь

remzalp 3 дек 2020 в 15:00

Вот у меня есть интересное ощущение, что % цены собственно кремния и прямых расходов на изготовление в продажной цене итогового процессора не превышает 10%

Да, с увеличением размера увеличивается шанс брака, но в цене так же будет:
1. Окупаемость существующего оборудования
2. Инвестиции в будущее оборудование
3. Текущие и будущие расходы на R&D
4. Маркетинг
5. Немного прибыли

так что прямая себестоимость значительно не вырастет, а вот насколько вырастет цена. которую пишет Интел на коробочке — открытый вопрос.

НЛО прилетело и опубликовало эту надпись здесь

Antervis 3 дек 2020 в 09:21

Раз пошла такая гонка, то AMD/Intel могут и увеличить L2. Что будет тогда?

сработает эффект убывающей эффективности — дальнейшее увеличение размеров кеша всё меньше влияет на производительность, а прирост цены и энергопотребления остается линейным.

НЛО прилетело и опубликовало эту надпись здесь

Antervis 3 дек 2020 в 14:38

У АМД большой L3 + маленький L2 и это даёт выигрыш, но по вашему, если сделать один l2 в размер l3, то увеличение этого кэша приведёт к падению производительности?
Ваша логика как обычно — шикарна.

процитируйте пожалуйста, где я это утверждал? Вам когда-нибудь надоест придумывать себе повод для спора?

НЛО прилетело и опубликовало эту надпись здесь

Antervis 3 дек 2020 в 17:15

Может это вы читать научитесь или отвечать на то, что человек спрашивал, а не на то, что вам захотелось?

человек спросил что будет если intel/amd увеличат размер L2 кеша, и я ответил именно на этот вопрос. Без додумок. Вы же каким-то чудом умудрились исковеркать и вопрос, и мой ответ, после чего драконите меня за это. Еще раз: где я утвердждал что «если сделать один l2 в размер l3, то увеличение этого кэша приведёт к падению производительности»? Нигде, это плод вашего больного воображения. Еще раз напомню, что вопрос «что будет если наращивать L2 за счет L3» никто не задавал.

НЛО прилетело и опубликовало эту надпись здесь

khajiit 3 дек 2020 в 17:52

А разве поиск не параллельный?
Там же вроде смысл в том, что у каждой строки кэша есть свой tag — по сути, кусок младшей части адреса без финальных нулей.
И на каждую операцию должен сматчиться тег во всем кеше.
тоже мимокрокодил

creker 3 дек 2020 в 18:04

Искать? В кэшах никто не ищет, там обращаются по четким адресам, т.к. адреса памяти мапятся на конкретные строки в кэше.

НЛО прилетело и опубликовало эту надпись здесь

Antervis 3 дек 2020 в 19:20

Угу, то есть цитаты сравнения кешей до этого не было, ага.

процитированный текст написал автор статьи а не автор вопроса. Цитата не меняет вопрос, а лишь указывает контекст.

И ещё, как увеличение кеша L2 может понизить производительность, даже если рядом будет кэш L3?

в третий раз: процитируйте где я это утверждал.

Итого — вы захотели ответит негативно и готовы для этого выдумывать любые отговорки.

первый негативный комментарий в треде — ваш:

Опять у вас 2+2!=1+3? Ваша логика как обычно — шикарна. Процитирую, так как читать вы не умеете:

Так кто в итоге «захотел ответить негативно и выдумал для этого любые отговорки»?

Человек так же не требовал сохранять L3 в том вопросе — Вас это не остановила от домыслов

вот только это ваш домысел.

-1

НЛО прилетело и опубликовало эту надпись здесь

Antervis 3 дек 2020 в 21:48

Во-первых, я рассмотрел ровно тот случай про который был вопрос — увеличение размера L2 кеша без изменений чего-либо другого. «Всё меньше влияет на производительность» это не то же самое что и «производительность уменьшится», как вам очень бы хотелось это читать. Что такое «эффект убывающей эффективности» вам тоже неведомо. Но спорите так яро, словно я у вас на спине Мохамеда вытатуировал.

Во-вторых, что касается самого вопроса — Maccimo будьте добры, рассудите нас.

-2

Maccimo 5 дек 2020 в 15:25

Вопрос был про увеличение размера L2 кеша. Дополнительных ограничений типа «без изменения чего-либо другого» не было. Если ограничение явно не прописано в ТЗ, то исполнитель волен трактовать так, как ему удобно.

В данном случае трактовка могла быть и в сторону уменьшения L3, если это имеет практический смысл для задачи увеличения производительности.

НЛО прилетело и опубликовало эту надпись здесь

Antervis 6 дек 2020 в 16:18

Мне ведомо. Только в вашей голове это означает, что если 1 часть L2 и 10 частей L3, то нет смысла наращивать L2, типа эффективноть будет убывать

нет, нет, и нет. "В моей голове" это означает, что увеличение кеша будет увеличивать производительность в уменьшающейся пропорции. Вы же каким-то невероятным образом прочитали «от увеличения кеша уменьшается производителность», чего я не говорил

то можно наблюдать, что по сливам 5800U на тех же 7 нм в тесте одного ядра выгребают на 20% больше, чем 4800U

тот самый слив 5800U, 4800U в том же бенче. Не 20%, а все 40%. Вот только догнать M1 даже этих 40% не хватит. Более того, 5800U едва обходит M1 через rosetta2.

и вот уже Эпловский обмазанный кешем l2 проц окажется отстающим по производительности, угу.

а вы не задумывались что эпловский M1 может обходить ryzen'ы не только потому что там L2 большой, а еще потому, что там двухуровневый кеш с быстрой оперативкой вместо трехуровневого кеша?

Итого, вы чушь выдали, но теперь готовы юлить как угодно, с целью оправдаться, даже исходный вопрос перевирать, как вам угодно

Человек говорит «интерпретируйте как хотите», вы мне доказываете что я не прав потому что интерпретировал не как вы. Неужели за всю вашу жизнь не нашлось человека который вам объяснит что мир вообще-то не вокруг вас крутится?

НЛО прилетело и опубликовало эту надпись здесь

Antervis 7 дек 2020 в 10:18

о, наконец-то вы признали, что не из-за чудесных ядер.

а где я утверждал что кеш не влияет? Черт подери, когда вы наконец перестанете выдумывать?

Прямая ложь. Вы сознательно интерпретировали так, чтоб не было увеличения производительности

да да, а процитировать вторую часть утверждения рука не поднялась, да? Потому что она противоречит вашим фальшивым доводам?

Дополнительных ограничений типа «без изменения чего-либо другого» не было. Если ограничение явно не прописано в ТЗ, то исполнитель волен трактовать так, как ему удобно.

других дополнительных ограничений тоже не было. Собственно, так я и интерпретировал — без каких-либо дополнительных ограничений, условий или додумок

А теперь секунда фактов. Просто увеличивая L2 за счет L3 в x86 проце вы всё равно не придете к схеме «быстрый L1 и общий L2», для этого в x86 процах надо полностью убирать именно L2. Ну либо объединять L2 и отказываться от L3, не принципиально, это всё равно не будет «уменьшение L3 в пользу L2».

А теперь наконец-то потрудитесь прочитать тред. Потому что мне надоело тыкать носом в откровенную ложь, ничего из того с чем вы спорите я не говорил

FreeNickname 3 дек 2020 в 21:56

С этим человеком бесполезно спорить, оставьте) Это не в первый раз уже.

НЛО прилетело и опубликовало эту надпись здесь

FreeNickname 7 дек 2020 в 13:53

Да, да, всё хорошо, вы молодец)

iChaos 3 дек 2020 в 10:22

Интересно, как они реализовали такие большие L1? Насколько я понял, то для производительных ядер, кэш L1 данных составляет целых 128KiB на ядро!
Как они смогли такого добиться?

Ввели 32-канальную ассоциативность?
Увеличили минимальный размер страницы до 16KiB?
Отказались от VIPT в пользу PIPT?

Viknet 3 дек 2020 в 12:48

Увеличили минимальный размер страницы до 16KiB?

Да, стандартный размер страницы в нативном режиме именно 16KiB.

Sap_ru 3 дек 2020 в 18:30

Даже больше — у производительных ядер 192 КБ кэша команд на ядро.
Скорее всего это связано с количество декодеров команд. Чем шире декодер, тем больший кэш он может переварить (так как выше глубина и темп предвыборки).
Соответственно, можно не ассоциативность увеличивать, а тупо длину строки. Тем более, что современные компиляторы исторически генерируют для ARM очень линейный код (в том плане, что за счёт условных операций используется меньше ветвлений, и ветвления гораздо более близкие чем на x86). По моим наблюдениям сложные функции на ARM гораздо чаще представляют собой один непрерывный блок кода, который удобно грузить в кэш, в то время, как x86 исторически полагается на предсказание ветвлений и эффективное увеличение кэша требует увеличения ассоциативности.
Очень интересный вопрос, между прочим.

Endeavour 3 дек 2020 в 10:55

В таких бенчмарках компиляции, собирают ли все тестируемые машины (архитектуры) код под одну и ту же архитектуру, или каждый под свою собственную? В последнем случае возникают сомнения в данных бенчмарка, ведь тестируются разные ветви кода/компиляторы.

rwscar 3 дек 2020 в 12:38

А мне одному кажется, что на скорость бенчмарка прилично влияет производительность накопителя? Файлов-то много, чтений тоже. И есть подозрение, что эппл так хорошо себя показывает как раз за счёт более быстрого SSD.

НЛО прилетело и опубликовало эту надпись здесь

rogoz 3 дек 2020 в 17:01

После прочтения статьи прямо тянуло пошутить в стиле «ну надеюсь на дектопе на HDD тестировалась компиляция».

VREMIKS 3 дек 2020 в 12:38

Конечно результат есть, но я бы сказал, что при той же ядровооруженности Intel и AMD имеют сравнимые показатели, а вот сравнивать М1 за $1000 с Ruspberry PI за $100 и говорить, что это «чудо» как-то странно. Я думаю, если бы «малинка» была бы хотя бы размером с М1, то и показатели у нее были соответствующие. Здесь же в 10 раз дороже, в 10 раз больше и как следствие в 10 раз быстрее. Пока все закономерно.

-4

deseven 3 дек 2020 в 12:51

А можно в студию модель/модели процессоров от Intel или AMD, которые при TDP 10-20W дают схожую производительность? А то вы жалуетесь на сравнение несравнимого, занимаясь при этом тем же самым.

androidovshchik 3 дек 2020 в 16:29

а вот сравнивать М1 за $1000

Это цена всего устройства (хоть и с переплатой за бренд), а не одной платы

если бы «малинка» была бы хотя бы размером с М1

Дело далеко не в размере

wigneddoom 3 дек 2020 в 18:42

Простите за грубость, но откуда вы такие берётесь? (с)

Малина, в плане железа — это самое убогое что только можно придумать. Это ублюдский древний броадком. Это вечные проблемы с охлаждением, кривыми кодеками и т. д.

Малина выезжает за счёт неплохой поддержки со стороны софта и большого сообщества. Она как Ардуино, которое нафиг никому не нужно, если ты открыл для себя STM32 за те же деньги.

Сравнивать M1 с древним броадком, ну я даже не знаю что тут сказать. Тема про компиляцию, запустите на RPI компиляцию и офигейте от результатов.

kivsiak 4 дек 2020 в 14:25

А какая есть альтернатива малине за те же деньги?

iproger 3 дек 2020 в 19:27

Малина на 8гб с полным набором типа зарядки и корпуса с радиаторами стоит больше $100. Макмини стоит $699. Уже 7 раз или меньше. А с маком еще идет ssd на 256гб в комплекте.
Что до разницы в производительности, там не 10 раз, а просто пропасть.
Я до сих пор не понимаю откуда за малину такие цены с таким cpu который даже в 2015 г. был бы слабым. Сделать настолько плохое соотношение цена-качество это надо уметь.

SinsI 3 дек 2020 в 22:30

Target: arm64-apple-darwin20.1.0

Вот эта строчка всё портит.
Хотелось бы сравнить билды с одинаковыми target, чтобы выдавался полностью идентичный бинарник.
Без этого же результаты могут сильно отличаться просто потому, что какие-то куски кода были выкинуты каким-нибудь #ifdef.

Viknet 3 дек 2020 в 23:28

В комментариях к оригинальной статье на reddit приводили сравнение нативной и кросс-компиляции.

spam-receiver 3 дек 2020 в 23:11

Ядро RISC-V на частоте 5,2 ГГц установило рекорд по производительности на ватт и обошло Apple M1 на два порядка

Viknet 3 дек 2020 в 23:38

Пока что выглядит фейком. Тем более, что M1 вообще не замерялся в этом конкретном тесте: "The M1 chip is roughly the equivalent of 10,000 CoreMarks in EEMBC terms". А если прочитать следующее предложение, то становится вообще смешно от таких оценок: "The fastest Arm processor under EEMBC benchmarks is the Cortex-A9 (quad-core), with a figure of 22,343 CoreMarks."

НЛО прилетело и опубликовало эту надпись здесь

igor-sheludko 8 дек 2020 в 22:11

Я так понимаю в тесте на M1 компилятор работал нативный. А если запустить версию для интела в режиме эмуляции?

khajiit 8 дек 2020 в 22:49

А зачем в эмуляции, если можно кросскомпилировать сразу под x86_64?
Будет сборка одного и того же бинарника одним и тем же тулчейном, собраным нативно под две платформы.
Ну и, для сравнения, кросскомпиляцию под arm включить в тесты для x86.

crystax 28 дек 2020 в 12:17

Я сравнивал. Делал сборку Folding@Home на двух Mac Mini 16 GB RAM, но один с Apple M1, а второй с Intel i7 Core (оба 3.2 GHz). Писал об этом в LinkedIn. Там даже более показательный тест получился. На обеих машинах велась сборка четырёх вариантов Folding@Home core: три для x86_64 (sse2, avx, avx2) и один для aarch64. Т.е. по логике некоторых здешних комментаторов, был дисбаланс в сторону более сложного оптимизатора.

Цифры говорят сами за себя

khajiit 28 дек 2020 в 15:03

Впечатляет. При задействовании всего 4х ядер M1 обошел на треть 4+HT x86… хотеть на нем линукс.

crystax 28 дек 2020 в 17:29

Не совсем так. Сборка на M1 велась с помощью scons -j8, а на Intel i7 Core — scons -j12, в соответствии со значениями, что выдавала команда sysctl -n hw.ncpu. Т.е. M1 – 8 ядер, а i7 – 6 ядер + HT.

А Linux я на нём завёл с помощью qemu:

Linux on Apple M1

Даже в эмуляторе (но с нативной поддержкой hvf) получилась мощная билд машина. По крайней мере, намного мощнее любого современного ARM девайса с Linux на борту, доступного за разумные деньги.

Mairon 10 дек 2020 в 00:07

Интересно, чем ответит Qualcomm с новой ревизией Snapdragon 8cx. Жду Chromebook на такой железке, а то они все либо на Intel, либо на дешманских Mediatek и Rockchip. Какой-никакой, но комп на Linux.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Компиляция C/C++ на Apple M1

Комментарии 163

Публикации

Истории