Как стать автором
Обновить

Встречаем WSE-2: 7-нм процессор с 850 тысячами ядер и энергопотреблением в 15 кВт

Время на прочтение3 мин
Количество просмотров26K
Всего голосов 53: ↑50 и ↓3+47
Комментарии66

Комментарии 66

НЛО прилетело и опубликовало эту надпись здесь
если на каждый церебрас по целой пластине тратить

Еще интересно сколько там пластин в мусор уходит, чтобы получить одну годную.

НЛО прилетело и опубликовало эту надпись здесь

Эдакий МультиКлет, получается.

Интересно, возможна ли малварь (ну или не малварь), которая оживляет заблоченные на заводе ядра и биткоины на них майнит (пусть иногда с ошибками). Оверклокинг будет не по количеству мегагерц выше нормы, а по количеству ядер :).
ще интересно сколько там пластин в мусор уходит, чтобы получить одну годную.
Они заявляют про процент выхода годных 100%, с учетом наличия в первом поколении 1.5% запасных ядер, а во втором — «намного меньше, чем в первом».
НЛО прилетело и опубликовало эту надпись здесь
30% брака это на старте линии или на уже отлаженной? А то эти цифры значительно различаются.
НЛО прилетело и опубликовало эту надпись здесь
На нём crysis хоть пойдёт?

нет, только брутал дум кое-как

НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
тепловые трубки не унесут столько мощности с такой площади, инфа 100%. по трубкам надо сразу воду качать
У 3M есть специальная жидкость для погружного охлаждения. Она просто кипит на поверхности кристалла.
При кипении теплоотвод ухудшается из-за образующихся пузырьков пара. Проточная вода в данном случае наверно эффективнее.
Проточная вода проводит электричество в отличии от этой жидкости. И её как минимум местами используют, хоть она очень дорогая и активно испаряется. Возможно на глубине за счёт давления пузырьки крошечные и не влияют. Зато работает естественная конвекция, плюс пожаробезопасность.
Так тут 15 кВт на 0,05 м. Ну и вода контакта непосредственного не имеет с кристаллом, снимает тепло с цельной медной пластины — фотка ниже.
Можно дейтерийной водой непосредственно охлаждать, у неё проводимость гораздо ниже, а цену такого контура владельцы Cerebras себе наверняка позволить могут.
А если протечка? Минус дорогущий сервер и те что под ним. К тому же на самой материнке нужно часть горячих элементов охлаждать(те же конвертеры питания или мосты).
А так бахнул комп в сухую воду или масло. И защита и охлаждение.
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь

Ну там я так понял был анонс что мол вот будем такое делать, а тут уже готовый продукт.

НЛО прилетело и опубликовало эту надпись здесь
Может, когда-то подобное будет в AWS с прайсом в $5000 в час…
Тогда представляю стартаперов, которые будут рассуждать «что-то пока наша модель, которая должна сделать прорыв в ИИ не фитится, но ничего, чуток инвестиций поднимем, часов 100 возьмем машинного времени, и тогда стартап точно взлетит»
". Как это охлаждать? :D"
СЖО Cerebras

СЖО Cerebras
про питание и охлад, тут более менее на слайдах понятно: 3dnews.ru/992698
Интересно, почему столь скучным заказчикам достается такая мощь. Неужели обладание подобным чипом не может дать буст Гуглу в улучшении поиска, Тесле в улучшении автопилота, или, Фейсбуку в оптимизации рекламы?
А что, проведение симуляции атомных взрывов уже записали в скушности?
Это как раз очень даже весёлые заказчики.

У вас иммунитет от рака?

НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
видимо, речь идет про обучение, а не про бортовую систему.

Вот он — триумф вертикального масштабирования! In-memory база данных поверх такого процессора способна будет обрабатывать десятки, сотни миллионов или возможно даже миллиард serializable транзакций в секунду и способна заменить сотни/тысячи серверов (и тот огромный оверхед при реализации распределенных транзакций в случае горизонтального масштабирования) определенно точно найдет своего покупателя.
Интересно как в этом процессоре работает механизм cache-coherence который обеспечивает CAS ("compare-and-swap") и другие атомарные обновления памяти? Cache-coherence это другими словами реализация атомарного бродкаста и поскольку это и так самая сложная часть при проектировании современных процессоров то здесь при 850 тысяч ядрер и возможном отказе этих ядер по отдельности проектировщики должны были выйти на уровень распределенных систем (интересно они реализовали paxos в железе?)

Никак. Это же не процессор общего назначения.

Чую для баз данных скоро тоже будут делать специализированные процессоры. Ещё более оптимизированные. Следующий шаг — реализация элементов языков запросов силами процессора, индексация таблиц силами встроенной памяти (типа «умная память» с дополнительной обработкой информации).
думаю с транзакциями там было бы все очень очень плохо, ибо очень большие проблемы горизонтальной синхронизации данных и т.п. для ридонли возможно разве что
Привели бы единицы измерения в столбцах к одной размерности. А то к Nvidia A100 пропускная шины в гигабайтах/сек, а к Cerebras в петабитах/сек.
К битам или байтам.
Зачем? Ведь в попугаях (битах вместо байт), удав получается значительно длиннее! (с) маркетологи.
Интересно почему он не круглой формы раз размером с кремниевую пластину, зачем же лишнее отрезать?
Технология видимо не позволяет изготовлять круглые процессоры, т.к. адаптирована с маленьких. А значит там остаётся пустое место, которое никак не задействуется. Его откалывают и отправляют на повторный круг.
Его откалывают и выбрасывают. Кстати если они их сразу не уничтожают, то скоро на ali появятся миниатюрные Cerebras из кусочков :-)
Делали бы уже шар, с сокетом в виде двух полушарий и в сокете же подведение воды…
Потому что все литографические шаблоны (через которые «проецируется» схема чипа на пластину) и литографическая оптика работает с прямоугольными областями, разработанными для производства классических чипов. Никто под один даже сверхсложный чип свое собственное производственное оборудование разрабатывать и строить свои собственные отдельные заводы не будет, используют(адаптируют) то, что уже имеется.

Вот из таких областей (их на фото четко видно 12х7 «плиток») чип и составлен. Края куда уже не вписывается еще один подобный прямоугольных обрезаны.
Края куда уже не вписывается еще один подобный прямоугольных обрезаны.
В целом вы правы, но все чуть-чуть сложнее.
image
Это усложнит технологию отделения кристаллов. Квадрат вписанный в круг легко отделить автоматически(и потом поделить на дольки), а вот огрызки придётся вручную доламывать.
Интересно, сколько мегахешей даст на эфире или битке? :)
Интереснее, сколько хешей на Вт приходится. А то может цифра будет впечатляющей, но платить за 15 кВт…
Все.

Цена известна?

Порядка 5 миллионов долларов за системный блок.
Интересно, 1С ERP потянет?
Поговаривают, что там минимальные требования от 250мм х 250мм
Ждём тестов в майнинге

Так мы его почти год назад встречали уже. И на Хабре писали:
https://habr.com/ru/company/selectel/blog/516516/
Тут конечно информации чуть больше. Но ажиотаж все равно непонятен.
А еще на многих ресурсах восхищенно обсуждают кол-во ядер. Забывая, что это не те ядра, что мы привыкли видеть в цп, а ближе к тем, что в видеокартах. Которые, кстати, тоже исчисляются тысячами давно.

В 90х был проект транспютеров с языком параллельного программирования Оccam. Может опять станет востребованным. Тогда он работал на десятках связанных процессоров

Кмк, даже не учитывая языков вроде erlang, любой современный язык сможет утилизировать все эти 100500 ядер. Все зависит от архитектуры приложения и системы.

Одно не понятно: зачем на одной платине? В чём преимущество? Почему нельзя разрезать и установить отельные кристаллы как делала IBM для своей System/390 ES9000 Enterprise Server mainframe computer ещё в 90-х?

850к ядер? Даже если по 16 ядер на кристалл, это будет 53к кристаллов. На одной пластине проще сразу все сделать.

НЛО прилетело и опубликовало эту надпись здесь
Все ради увеличения пропускной способности памяти. Это просто следующий шаг по сравнению с упомянутым вами девайсом от IBM. На него раньше не решались, потому что предыдущие попытки неизменно ломались об низкий процент выхода годных.
Не смешите. Пропускная способность памяти с одного края кристалла до другого будет не лучшей. Судя по квадратикам на пластине там N ядер + память разбиты на ячейки. И именно эти ячейки делают вычисления. Не думаю, что данные там сильно бегают от ячейки к ячейке. Если пластину разрезать и смонтировать эти ячейки так как у того же IBM — ухудшится всё не сильно. Но зато конструктив упростится, меньше проблем с неравномерным нагревом кристалла, с хрупкостью и тому подобным. Это больше похоже на "А потому что могём! А потому что круто!". Да можете. Да круто. Вот только преимуществ толком не даёт.
Не думаю, что данные там сильно бегают от ячейки к ячейке.
Заявленная пропускная способность коммутационного массива — 220 петабит в секунду.

Если пластину разрезать и смонтировать эти ячейки так как у того же IBM — ухудшится всё не сильно.
Ухудшится принципиально. Емкость линии между двумя чипами — несколько пикофарад, индуктивность — несколько наногенри. Когда мы говорим о сотнях тысяч или миллионах линий, этого вполне достаточно, чтобы серьезно влиять и на быстродействие, и на энергопотребление.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий