Pull to refresh

Comments 45

Я чего-то не понял: процессор собственной разработки с инструкциями SSE? Они что, повторили систему команд x86 (x86_64)? По лицензии или как?
Китайская компания Zhaoxin, совместное предприятие Via Technologies и правительства Китая

А у VIA есть лицензия на x86.

У VIA есть много лицензий.
Может и на ARM тоже

UFO just landed and posted this here
У Интел с АМД есть кросс-лицензионное соглашение. АМД может использовать наборы инструкций Интел, Интел может использовать наборы инструкций АМД.

maybe_elf торопится закрыть план по буквам за неделю, поэтому даже не читал что пишет.
Некогда.


Судя по гуглам система команд x86-64.

Очень интересное решение, и не только для DIY. Но и, например, для госучреждений. И цена наверняка будет получше, чем у некоторых.

Я тут на неделе задумывался приобрести материнскую плату на два ксеона E5-26xx и 128 гигов памяти. Материнка стоит ~7к, два E5-2689 по ~3.5к за штуку – вместе ~7к и четыре планки по 32 гига ~14к вместе. 28 тысяч рублей на китайские комплектующие, какой-нибудь Sun F80 на 800 ГБ энергонезависимой памяти за ещё ~14к на ебее, блок питания – и вот готов шикарный сервер для домашних экспериментов: потренироваться в настройке гипервизор, поднять парк виртуалок, кубернетес накатить...


Но это всё в теории. На практике же боюсь грабель, несовместимости, китайского брака и, как следствие, нерационального расходования средств. :/

и вот готов шикарный сервер для домашних экспериментов: потренироваться в настройке гипервизор, поднять парк виртуалок, кубернетес накатить...

Да что в нём шикарного? Это же уже основательно дряхлый Sandy Bridge. Можно спокойно купить на несколько лет более современный десктоп, а-ля Ryzen 7 1800, и получить вполне сопоставимую производительность (процентов 20 меньше в многопотоке и почти в два раза больше в однопотоке) за те же деньги, при вчетверо меньшем энергопотреблении, практически бесшумной работе и бОльшими шансами, что это не сдохнет в силу своего возраста в ближайший год.
Учитывая возможную несовместимость серверного софта с «рязанью» первого поколения, я бы не рисковал, а взял бы надежный и проверенный временем «сандаль».
Учитывая возможную несовместимость серверного софта с «рязанью» первого поколения, я бы не рисковал

Это же не продакшен, какой там риск? Наоборот, когда надо будет поиграться с чем-то, что требует производительности, для этой платформы впереди будет ещё три поколения процессоров, и мощность можно будет увеличить в несколько раз. А систему с сэндиком можно будет только продать и покупать новую.

Риск – лишний раз потратить деньги. Хотя это относится не к райзену, а к китайской материнке. :)


Поиграться хочется с мультипроцессорностью, NUMA, гипревизоры и всяко прочее. На амдшном процессоре первых двух так точно нет. Насчёт гипрвизоров – не знаю, но наверняка должны быть.


И насчёт апгрейда – интеловскую систему можно будет улучшить с E5-2689 до E5-2697 v2. Плюс четыре ядра, плюс 100 МГц, минус ~12к денег на каждый сокет. И ещё плюс сколько-то тепла, да. Райзены мне в плане апргейдабельности и энергоэффективности нравятся куда больше.

Поиграться хочется с мультипроцессорностью, NUMA, гипревизоры и всяко прочее

Да там особо играться нечем, несколько настроек в BIOS, да несколько настроек в гипервизоре. В остальном SMT на двух камнях ничем не отличается от SMT на одном. Гипервизоры, конечно же, сейчас есть на всех платформах.

Ну, наверное, можно как-то писать NUMA-aware приложения. Или хотя бы запустить jvm с -XX:+UseNUMA, посмотреть как это влияет на производительность чего-нибудь и влияет ли сколь-нибудь сильно ли вообще.


Но да, что я собственно ожидал от "поиграться с NUMA"? Оно должно быть уже давно быть отдано на уровень ОС и самого процессора.


Да и гипервизоры для меня пока что тёмный лес. Хотя бы пару статей почитаю, но не оторванно от дела, а с хоть каким-то применением. :)

Постгресс на двух сокетах ведет себя худе, чем нА одном. Т.е. можно тренироваться писать NUMA aware приложения

Он шикарный за свою стоимость: 32 логических потока на 2.6 ГГц и 128 ГБ памяти за меньше чем тридцать тысяч рублей.


Если брать райзен, то придётся отказаться от удвоенного количества сокетов, да и оперативка ddr4 стоит в полтора-два раза дороже (а 32гиговых плашек я даже не нашёл).


Но да, надёжность вызывает сомнения. Не факт, что оно вообще с первого раза запустится.

К вопросу о шикарности. Ради интереса мерил как-то производительность разных систем. Сборка прошивки с помощью yocto:
1) на рабочем ПК i5-4460 @ 3.20GHz × 4 — 60 минут;
2) на сборочном сервере 2xE5-2680 @ 2.70Ghz x 16 — 30 минут (2 процессора суммарно 32 потока);
3) на домашнем ПК r5 1600 @ 3.20GHz x 12 — 30 минут;
4) на домашнем ПК r7 2700x @ 3.70Ghz x 16 — 23 минуты;
5) на домашнем ПК r7 2700x @ 4.10Ghz x 16 — 22 минуты.
Уже больше года как на работе стоит r7 2700 — никаких проблем, есть перспектива апгрейда до 12-16 ядерников.
со сборочным сервером что-то не так, не вписывается в математику
12.8ГГц * 60минут = 768
86,4 * 30 = 2592
38,4 * 30 = 1152
59,2 * 23 = 1361
65,5 * 22 = 1443

В данном случае меньше = быстрее. У i5 очевидно выше IPC примерно на 15% и примерно столько накинем за отсутствие HT, а с Зионом судя по всему оно работало на одном процессоре(возможно выключен NUMA). У рязани мы видим примерно одинаковый показатель и Зеон если на одном процессоре, тоже вписывается в эту модель.
На сервере работают все ядра.
Тут много различных параметров, которые повлияли на конечный результат, но примерный результат отображают.
Во-первых, сборки различаются не только процессорами — но и количество/производительность RAM и носителей разные (на домашнем ПК до сих пор всего 8GB, на сервере 32GB; на домашнем SSD, на сервере — HDD, но на домашнем из-за малого количества ОЗУ все сваливается в свап, который на HDD; на рабочем и SSD, и 16GB RAM).
Во-вторых, SMT немного более производительней, чем HT.
В-третьих, в процессе сборки прошивки есть операции со стопроцентной загрузкой, так и c загрузкой только одного ядра. Из-за более высокой частоты рязань быстрее справляется с однопоточными задачами.
Ну а вообще, «чистая» рабочая производительность с идеальным распараллеливанием очень хорошо коррелирует с результатами в cinebench. Например, один E5-2680 — 900 очков, r5 1600 — 1200, r7 2700x — 1800. Но опять же, в однопоточных задачах процессоры с более высокой частотой окажутся впереди.
Добавлю свой тест cinebench 20 — 1790 pts
r52400g — без разгона
Две планки HyperX DDR4-3200 8gb 16 тайминги
Материнская плата Gigabyte GA-A320M-S2H V2 (b350 чипсет)

О, спасибо за своего рода бенчмаркинг.


Значит, более-менее аналогом двух 2xE5-2680 является один r5 1600. Что забавно, на том же злосчастном алиэкспрессе цена коррелирует с производительностью: два ксеона стоят ~3.5к, а один райзен – ~6.5к.


Единственное, что мне не нравится – цена оперативки и материнки, чтобы было куда её вставлять. Был бы неограниченный бюджет – я бы взял threadripper, тонну оперативки и пару сопроцессоров в виде видеокарт (а вдруг захочется поизучать нейронные сети?), но реальность и жаба накладывает свои ограничения, увы.

М-м-м.


  1. По ссылке идёт сравнение одного процессора серии E5-2xxx, то есть половина его смысла теряется. Стоило бы делать обзор на E5-1xxx, наверное.
  2. Далее, там интел разогнан с 2.6 до почти 3.6 ГГц. Амд, правда, тоже с 3.2 до 3.9 ГГц.
  3. Сравнение идёт в основном на играх, а не на серверных задачах.
  4. Плюс на сборочном серваке junari действительно могло быть что-то не так с NUMA (в коей я мало смыслю).

Так что мне кажется, что между системой с двумя стоковыми процесорами E5-2680 и системой с одним стоковым R5 1600 таки-будет равенство. Другое дело, что E5-2689 чуть мощнее E5-2680.


И да, вполне себе допускаю, что один разогнанный E5-2689 равен разогнанному R5 1600.

UFO just landed and posted this here

Под AM4 все процессоры, что я видел, требуют ddr4, а он дороже третьего. Хотя и задержки должны быть меньше, что приятно.


Ну вот на то и надеюсь, что через пару лет можно будет легко и непринуждённо собрать лютого зверя мощнее, чем может выйти сегодня. Сейчас-то новый амд 3700 стоит почти столько же, сколько вся система из первого комментария.


Есть ещё другая проблема – этот стенд, по сути, мне не нужен. Но слабое желание экспериментировать и возможность собрать не дают покоя. :)

UFO just landed and posted this here

Ну, у меня рабоче-игровой комп тоже с 16 гигами оперативки – и этого хвататет за глаза. Но я тоже что-то в последние полгода-года в даже в неособо требовательные игры не играл, всё время съедается работой и другими занятиями.


А материнки – да, в целом не отличаются, да им и нечем: только сокет да стандарт оперативки. Ну, может, M.2 куда завезут. (к слову, у китайцев есть за ~10к на 256 гигов памяти, но они стоят в два раза больше Асрок про4, да.)


Ну, истории про то, что процессоропроизводители делают все процессоры одинаковыми, а после тестирования в зависимости от качества чипа ставят разную частоту и маркировку, не нова. Мне вспоминается, что при некоторой удаче, перепаяв резистор с одного номинала на другой, можно было получить процессор (или то была видеокарта?) старшей модели.


Приятно, что современные технологии достигли текущего уровня. Полагаю, когда буду брать себе следующий основной комп, буду собирать его на основе уже амдшных процессоров. Впрочем, я начал думать так года полтора назад, но комп поменять за прошедшие лет десять так и не собрался. Только видеокарту помощнее поставил. Возможно, ещё лет пять… :D

UFO just landed and posted this here

Да, я где-то такое читал, полагаю, что на хабре в одной из статей про EPYC. В принципе, очень разумно – если мелкие детали статистически получаются лучше, чем крупные, то надо набирать устройство из них, будь то обыкновенный процессор, тот Cerebras, советские часы для Союза или суперкомпьютер. :D


Полагаю, что за семь лет между 3-4 поколениями core (2012-2013 годы) и райзенами 2-3 (2018-2019 годы) вышли кучи векторных расширений, улучшились планировщики, предсказатели и прочие мелкие бесы плоского кремниевого мира. Да и техпроцесс изменился.


Посмотрел на каком-то сайте, у меня, по его данным, процессор сейчас на уровне 2500. Если же сравнивать с 2600, то дополнительные два физических ядра его уделывают, да. Разве что я не понял, как они при переходе от 2600 к 3600 (от Zen+ к Zen2) при тех же частотах и ядрах умудрились нарастить +20% к производительности. Придётся брать райзен 5600 такими темпами.


Что за работа-то такая, на которой без зазрения совести можно цивилизацию запускать? ;D

UFO just landed and posted this here
Ядра и потоки

Да, я как-то забыл, что в core i5 было 4 ядра без SMT, а в 2600 оно есть. Я дело имел либо с i3, либо i7, там фантомные логические ядра были всегда. :D


Исправляли недочеты, работу множества ядер с кэшем, да и сам кэш вроде нарастили.

Похоже на то. Минимум две новые команды для работы с кешем, и ещё Википедия говорит, что как раз в Zen2 они перешли от классических кристаллов процессора к чиплетам, у них по центру кристалл I/O, а по краям – вычислительные ядра.


Это разумно, но я как-то не ожидал, что можно получить прирост в производительности, сменив архитектуру (избавившись от лишних вещей).


на пару дней затишье относительное

Ха, я в такое время хабропльзуюсь. Как сейчас. :)
Ну, да, это только моя совесть мешает мне запускать игры на работе. Так-то оно разумно: нет работы – занимайся чем угодно, особенно если коллеги поддерживают, вместе веселее.

UFO just landed and posted this here
Не совсем. Нужно сравнивать конкретные задачи. Где-то быстрее, но в большинстве случаев все-таки медленнее. Примерно наравне будут 8-ядерные.

Ну и у 1600 частота 3,2 — по спецификации. А в реале частота на все ядра без разгона будет 3,7.

Понятно.


А разве 3.7 – не та частота, до которой процессор может разогнаться на пару секунд, поймав в задаче момент, с которым кратковременно не справляется? Я почему-то полагал, что Turbo-boost в описаниях процессоров значит именно это. Или это так было дет десять назад. :/

Там все очень запутано с частотами. Вот сейчас на r7 2700, у которого базовая частота 3,2, максимальная частота на все ядра держится в районе 3,4, а при меньшем количестве ядер частота еще выше.

Наверное, я немного приврал с частотой 3,7 для r5 1600, но помню, что она точно была выше, чем 3,2.
У меня есть такая система, на 2х2689 + 256Гб RAM- там 3.3Ггц на ядро в фулл-бусте.
Топовые райзены будут побыстрее за счет сильно бОльшей производительности ядро\Ггц, особенно в задачах, требующих высокой производительности именно на ядро.
В общем, райзены будут во всем лучше, кроме итоговой цены и вдвое меньшего кол-ва ядер (для обычных задач это неважно).

Но вообще, на подобной рабочей станции за ~25к работать зело приятно — все крутится без тормозов, включая пяток «полноценных» виртуалок для работы и еще столько же для экспериментов.

А система какая-то человеческая (Dell, Supermicro) или на китайский самосборный нонейм?


Лично я планировал её использовать как сервер для фоновых задач: веб-сайты всякие, системы сборки для себя и друзей, виртуалки для экспериментов, но не как замену основному компьютеру. Однако если это удобно – то почему бы и нет, действительно.

Обычный китайский ноунейм за 7к+флешка в подарок :)).
С фирмовой платой будет на 3-4 тысячи дороже, но на них как правило есть проблема с 16х PCI-E слотами (либо их нет, либо они специфические по конструкции). На китайца можно поставить нормальную видеокарту.

BIOS на плате от какого-то серверного Интела, т.е. для любителей разгона не подойдет.

ЗЫ
Говорят, что на старых партиях подобных плат были косяки со вторым банком памяти — не был пропаян (или даже распаян). В моем экземпляре все 8 слотов работают.

ЗЗЫ
И да, процы довольно горячие, самые дешевые воздушные башни при полной нагрузке не справляются. Впрочем, с райзенами, которые якобы 105Вт тоже.
Поэтому, если гонять эту сборку в хвост и гриву, лучше взять либо 6-трубочные башни, либо (еще лучше) 2 мелких водянки и вытащить их наружу (благо они стоят по 2.5-3 тыщи, что сравнимо со средней руки башней).

Окей, вы успокоили мою мятущуюся мысль. :)


Значит есть люди, у которых это работает, и они при этом счастливы. Наверное, можно примерить этот опыт и на себя, надеясь, что мои кривые руки не положат конец мечтам.


Как раз думал, что надо помпу от аквариума поставить гонять какой-то диэлектрик. :D


Спасибо за объяснения, наверное, я тоже себе потом что-то подобное сооружу. Если райзены внезапно не подешевеют. :)

Надо учитывать, что 2 сокета, чаще значительно хуже по перформансу, чем 1. Особенно если нет NUMA-aware или вам нужны все ядра и прочее.
Такие сборки были шикарны до недавнего времени, до райзеновской эпохи.
Сейчас под одной крышкой у райзена можно получить намного большую производительность и для однопоточных и многопоточных задач. И интел в ужасе роняет цены и пытается втиснуть больше ядер.
Учитывая наличие гарантии на комплектующие, то это все сильно перевешивает и делает такой вариант может хорошим, но точно не шикарным в сравнении.

Вот как раз NUMA и прочая хочется поковырять в свободное время.


Да, для райзена в пересчёте на ядра и занимаемое стойко-место производительность лучше, но у древнего б/у-шного интела выше производительность в пересчёте на стоимость всей системы в целом.


Но да, у непонятного китайского самосбора гарантий на стабильную работу никаких, потому и не бегу покупать детали, о чём в первом комментарии и говорил. :)

UFO just landed and posted this here
Это уже относится к DIY? Напомнило…

Re: Debian Installer etch beta 1 released
Повторяю — Юникс не рулит. И программирование на C с использованием vim — попса. Настоящие пацаны используют перфокарты и БЭСМ-3. Все остальные — жалкие любители, которые даже 286 процессор спаять дома не могут.
Eldhenn # (*) (13.11.2005 21:24:35)

© bash.im

Китайский KX-6780A в CPU-Z набирает 1396 баллов в мнопотоке и 171 для одного ядра. Мой i7 4700mq набирает 1846 и 365 соответственно. Молодцы китайцы.

Only those users with full accounts are able to leave comments. Log in, please.

Other news