skovalev 21 апр 2021 в 17:31

Встречаем WSE-2: 7-нм процессор с 850 тысячами ядер и энергопотреблением в 15 кВт

3 мин

26K

Блог компании SelectelВысокая производительность*ГаджетыКомпьютерное железоПроцессоры

+47

Комментарии 66

НЛО прилетело и опубликовало эту надпись здесь

isden 21 апр 2021 в 18:43

если на каждый церебрас по целой пластине тратить

Еще интересно сколько там пластин в мусор уходит, чтобы получить одну годную.

НЛО прилетело и опубликовало эту надпись здесь

perfect_genius 21 апр 2021 в 22:27

Эдакий МультиКлет, получается.

napa3um 22 апр 2021 в 13:02

Интересно, возможна ли малварь (ну или не малварь), которая оживляет заблоченные на заводе ядра и биткоины на них майнит (пусть иногда с ошибками). Оверклокинг будет не по количеству мегагерц выше нормы, а по количеству ядер :).

amartology 22 апр 2021 в 18:35

ще интересно сколько там пластин в мусор уходит, чтобы получить одну годную.

Они заявляют про процент выхода годных 100%, с учетом наличия в первом поколении 1.5% запасных ядер, а во втором — «намного меньше, чем в первом».

НЛО прилетело и опубликовало эту надпись здесь

Ark1774 23 апр 2021 в 11:36

30% брака это на старте линии или на уже отлаженной? А то эти цифры значительно различаются.

НЛО прилетело и опубликовало эту надпись здесь

ANIDEANI 22 апр 2021 в 06:53

На нём crysis хоть пойдёт?

Wingtiger 22 апр 2021 в 22:22

нет, только брутал дум кое-как

НЛО прилетело и опубликовало эту надпись здесь

atd 22 апр 2021 в 09:52

тепловые трубки не унесут столько мощности с такой площади, инфа 100%. по трубкам надо сразу воду качать

DGN 24 апр 2021 в 09:21

У 3M есть специальная жидкость для погружного охлаждения. Она просто кипит на поверхности кристалла.

drWhy 24 апр 2021 в 12:43

При кипении теплоотвод ухудшается из-за образующихся пузырьков пара. Проточная вода в данном случае наверно эффективнее.

Ark1774 24 апр 2021 в 15:43

Проточная вода проводит электричество в отличии от этой жидкости. И её как минимум местами используют, хоть она очень дорогая и активно испаряется. Возможно на глубине за счёт давления пузырьки крошечные и не влияют. Зато работает естественная конвекция, плюс пожаробезопасность.

drWhy 24 апр 2021 в 16:46

Так тут 15 кВт на 0,05 м. Ну и вода контакта непосредственного не имеет с кристаллом, снимает тепло с цельной медной пластины — фотка ниже.
Можно дейтерийной водой непосредственно охлаждать, у неё проводимость гораздо ниже, а цену такого контура владельцы Cerebras себе наверняка позволить могут.

Ark1774 25 апр 2021 в 08:24

А если протечка? Минус дорогущий сервер и те что под ним. К тому же на самой материнке нужно часть горячих элементов охлаждать(те же конвертеры питания или мосты).
А так бахнул комп в сухую воду или масло. И защита и охлаждение.

isden 21 апр 2021 в 18:48

В прошлой статье есть пара интересных картинок.

НЛО прилетело и опубликовало эту надпись здесь

isden 21 апр 2021 в 18:51

Там рассказали, а тут выпустили :)

НЛО прилетело и опубликовало эту надпись здесь

isden 21 апр 2021 в 18:55

Ну там я так понял был анонс что мол вот будем такое делать, а тут уже готовый продукт.

НЛО прилетело и опубликовало эту надпись здесь

algotrader2013 21 апр 2021 в 19:09

Может, когда-то подобное будет в AWS с прайсом в $5000 в час…
Тогда представляю стартаперов, которые будут рассуждать «что-то пока наша модель, которая должна сделать прорыв в ИИ не фитится, но ничего, чуток инвестиций поднимем, часов 100 возьмем машинного времени, и тогда стартап точно взлетит»

drWhy 21 апр 2021 в 19:28

". Как это охлаждать? :D"
СЖО Cerebras

MaximRV 22 апр 2021 в 13:21

про питание и охлад, тут более менее на слайдах понятно: 3dnews.ru/992698

algotrader2013 21 апр 2021 в 18:59

Интересно, почему столь скучным заказчикам достается такая мощь. Неужели обладание подобным чипом не может дать буст Гуглу в улучшении поиска, Тесле в улучшении автопилота, или, Фейсбуку в оптимизации рекламы?

-7

drWhy 21 апр 2021 в 19:32

А что, проведение симуляции атомных взрывов уже записали в скушности?

+12

spqr_voldi 21 апр 2021 в 20:50

Это как раз очень даже весёлые заказчики.

perfect_genius 21 апр 2021 в 22:25

У вас иммунитет от рака?

НЛО прилетело и опубликовало эту надпись здесь

ivankudryavtsev 22 апр 2021 в 12:32

видимо, речь идет про обучение, а не про бортовую систему.

bgnx 21 апр 2021 в 20:38

Вот он — триумф вертикального масштабирования! In-memory база данных поверх такого процессора способна будет обрабатывать десятки, сотни миллионов или возможно даже миллиард serializable транзакций в секунду и способна заменить сотни/тысячи серверов (и тот огромный оверхед при реализации распределенных транзакций в случае горизонтального масштабирования) определенно точно найдет своего покупателя.
Интересно как в этом процессоре работает механизм cache-coherence который обеспечивает CAS ("compare-and-swap") и другие атомарные обновления памяти? Cache-coherence это другими словами реализация атомарного бродкаста и поскольку это и так самая сложная часть при проектировании современных процессоров то здесь при 850 тысяч ядрер и возможном отказе этих ядер по отдельности проектировщики должны были выйти на уровень распределенных систем (интересно они реализовали paxos в железе?)

amarao 21 апр 2021 в 23:33

Никак. Это же не процессор общего назначения.

MaximRV 22 апр 2021 в 13:26

Чую для баз данных скоро тоже будут делать специализированные процессоры. Ещё более оптимизированные. Следующий шаг — реализация элементов языков запросов силами процессора, индексация таблиц силами встроенной памяти (типа «умная память» с дополнительной обработкой информации).

krote 22 апр 2021 в 19:43

думаю с транзакциями там было бы все очень очень плохо, ибо очень большие проблемы горизонтальной синхронизации данных и т.п. для ридонли возможно разве что

MaximRV 22 апр 2021 в 21:19

Интересные наработки: www.osp.ru/os/2019/02/13054946

QuakeMan 21 апр 2021 в 21:15

Привели бы единицы измерения в столбцах к одной размерности. А то к Nvidia A100 пропускная шины в гигабайтах/сек, а к Cerebras в петабитах/сек.
К битам или байтам.

Mad__Max 23 апр 2021 в 17:38

Зачем? Ведь в попугаях (битах вместо байт), удав получается значительно длиннее! (с) маркетологи.

Andrey_Dolg 21 апр 2021 в 21:57

Интересно почему он не круглой формы раз размером с кремниевую пластину, зачем же лишнее отрезать?

Ark1774 21 апр 2021 в 22:52

Технология видимо не позволяет изготовлять круглые процессоры, т.к. адаптирована с маленьких. А значит там остаётся пустое место, которое никак не задействуется. Его откалывают и отправляют на повторный круг.

alexey_public 21 апр 2021 в 23:20

Его откалывают и выбрасывают. Кстати если они их сразу не уничтожают, то скоро на ali появятся миниатюрные Cerebras из кусочков :-)

stalinets 21 апр 2021 в 23:36

Делали бы уже шар, с сокетом в виде двух полушарий и в сокете же подведение воды…

Mad__Max 23 апр 2021 в 17:42

Потому что все литографические шаблоны (через которые «проецируется» схема чипа на пластину) и литографическая оптика работает с прямоугольными областями, разработанными для производства классических чипов. Никто под один даже сверхсложный чип свое собственное производственное оборудование разрабатывать и строить свои собственные отдельные заводы не будет, используют(адаптируют) то, что уже имеется.

Вот из таких областей (их на фото четко видно 12х7 «плиток») чип и составлен. Края куда уже не вписывается еще один подобный прямоугольных обрезаны.

amartology 23 апр 2021 в 19:18

Края куда уже не вписывается еще один подобный прямоугольных обрезаны.

В целом вы правы, но все чуть-чуть сложнее.

Ark1774 24 апр 2021 в 16:09

Это усложнит технологию отделения кристаллов. Квадрат вписанный в круг легко отделить автоматически(и потом поделить на дольки), а вот огрызки придётся вручную доламывать.

ba00 21 апр 2021 в 22:53

Интересно, сколько мегахешей даст на эфире или битке? :)

-2

qyix7z 22 апр 2021 в 07:16

Интереснее, сколько хешей на Вт приходится. А то может цифра будет впечатляющей, но платить за 15 кВт…

-3

sappience 22 апр 2021 в 08:32

Все.

Jetmanman 22 апр 2021 в 07:20

Цена известна?

amartology 22 апр 2021 в 18:37

Порядка 5 миллионов долларов за системный блок.

sheru 22 апр 2021 в 07:34

Интересно, 1С ERP потянет?
Поговаривают, что там минимальные требования от 250мм х 250мм

smiface 22 апр 2021 в 08:32

Ждём тестов в майнинге

-2

p_fox 22 апр 2021 в 09:17

Так мы его почти год назад встречали уже. И на Хабре писали:
https://habr.com/ru/company/selectel/blog/516516/
Тут конечно информации чуть больше. Но ажиотаж все равно непонятен.
А еще на многих ресурсах восхищенно обсуждают кол-во ядер. Забывая, что это не те ядра, что мы привыкли видеть в цп, а ближе к тем, что в видеокартах. Которые, кстати, тоже исчисляются тысячами давно.

dim2r 22 апр 2021 в 09:45

В 90х был проект транспютеров с языком параллельного программирования Оccam. Может опять станет востребованным. Тогда он работал на десятках связанных процессоров

isden 22 апр 2021 в 12:27

Кмк, даже не учитывая языков вроде erlang, любой современный язык сможет утилизировать все эти 100500 ядер. Все зависит от архитектуры приложения и системы.

Nick_Shl 22 апр 2021 в 18:05

Одно не понятно: зачем на одной платине? В чём преимущество? Почему нельзя разрезать и установить отельные кристаллы как делала IBM для своей System/390 ES9000 Enterprise Server mainframe computer ещё в 90-х?

isden 22 апр 2021 в 18:18

850к ядер? Даже если по 16 ядер на кристалл, это будет 53к кристаллов. На одной пластине проще сразу все сделать.

НЛО прилетело и опубликовало эту надпись здесь

amartology 22 апр 2021 в 18:44

Все ради увеличения пропускной способности памяти. Это просто следующий шаг по сравнению с упомянутым вами девайсом от IBM. На него раньше не решались, потому что предыдущие попытки неизменно ломались об низкий процент выхода годных.

Nick_Shl 22 апр 2021 в 20:44

Не смешите. Пропускная способность памяти с одного края кристалла до другого будет не лучшей. Судя по квадратикам на пластине там N ядер + память разбиты на ячейки. И именно эти ячейки делают вычисления. Не думаю, что данные там сильно бегают от ячейки к ячейке. Если пластину разрезать и смонтировать эти ячейки так как у того же IBM — ухудшится всё не сильно. Но зато конструктив упростится, меньше проблем с неравномерным нагревом кристалла, с хрупкостью и тому подобным. Это больше похоже на "А потому что могём! А потому что круто!". Да можете. Да круто. Вот только преимуществ толком не даёт.

amartology 22 апр 2021 в 20:51

Не думаю, что данные там сильно бегают от ячейки к ячейке.

Заявленная пропускная способность коммутационного массива — 220 петабит в секунду.

Если пластину разрезать и смонтировать эти ячейки так как у того же IBM — ухудшится всё не сильно.

Ухудшится принципиально. Емкость линии между двумя чипами — несколько пикофарад, индуктивность — несколько наногенри. Когда мы говорим о сотнях тысяч или миллионах линий, этого вполне достаточно, чтобы серьезно влиять и на быстродействие, и на энергопотребление.

VityaYerpenko 23 апр 2021 в 16:22

Интересное железо

Зарегистрируйтесь на Хабре, чтобы оставить комментарий