Как стать автором
Обновить

В России разработан суперкомпьютер, который в 32 раза быстрее видеокарты GeForce RTX 2080 Ti

Время на прочтение4 мин
Количество просмотров68K
Всего голосов 38: ↑21 и ↓17+4
Комментарии52

Комментарии 52

Это на 0,1 TFLOPS больше, чем у видеокарты nVidia GeForce RTX 2080 Ti.

Это на 13 TFLOPS больше, чем у видеокарты nVidia GeForce RTX 2080 Ti (https://www.techpowerup.com/gpu-specs/geforce-rtx-2080-ti.c3305). Что за дурацкая идея, что скорость суперкомпьютера в 2019 году считают по одинарной точности?

В статье немного непонятно, что на самом деле
Суперкомпьютер «Фишер» состоит из 24 вычислительных узлов с 16-ядерными процессорами


Скорость по одинарной точности

Зависит от области приложений. Иногда достаточно и одинарной точности. На игровых карточках двойная точность урезана искусственно. Возьмите «Теслы»
Tesla v100 — 7.8 TFLOPS double, 15.7 TFLOPS single
С другой стороны часто нужно одинарная или даже половинная точность. Это может дать очень хороший буст в скорости обработки. 20хх как раз поддерживают половинную точность, + в последнее время, видел много статей про machine learning и половинную точность. Выглядит это очень многообещающе.

Ну пускай собирают на базе 20xx те, кому нужна одинарная или половинная точность. В институте пока что основная база программ требует двойной точности, поэтому собрали то, что удовлетворяет нуждам.
С видеокартами — стоит уже "Десмос", частично задача и в том, чтобы увести с него пользователей, которые видеокарты не используют.

Это наш суперкомпьютер или фото из интернета?
image
Это майнинг-ферма, погружённая в резервуар с сухой водой.
Фото взято из статьи 2014 года: Охлаждение погружением, серверы «под водой»: Immersion-2 для 3M™ Novec™ обеспечил волшебные результаты, применение на практике в Гонконге.
В России разработан = с чипом ТMSC
зануда моде ОН?

Юзер сабжа моде он.

Суперкомпьютер с производительностью как у видеокарты? И при том с системой иммерсионного охлаждения. У GeForce RTX 2080 Ti и TDP — 300 Вт.
Да, у меня тоже неоднозначные ощущения возникли от названия статьи) Зачем тогда такой суперкомпьютер, если есть видеокарта 2080Тi? Я понимаю, что у такого суперкомпьютера могут быть преимущества, но название статьи говорит что скорее в пользу 2080Тi. Типа покупайте видеокарту, у нее производительность такая же как у самого передового российского суперкомпьютера))
upd. Пока писал коммент, название изменили, и теперь оно действительно отражает суть статьи.
Ну так даже смешнее получается Россия наконец то одолела Нвидию
сколько лет понадобилось?
А ну да сделано то всеравно у ТМСЦ. Порядок!
А это как раз и не понятно.
Предыдущий кластер состоял из 32-х узлов с адаптерами на базе СБИС и процессорами Intel Xeon E5-1650 v3.

Ангара — это коммутатор, обеспечивающий передачу данных между «считалками».
НЛО прилетело и опубликовало эту надпись здесь

*почерпнуто из портала в ад

оттуда.
название изменили, и теперь оно действительно отражает суть статьи

Ну да, было "незваный гость хуже татарина", стало "незваный гость лучше татарина".
На самом деле, именно российская часть — интерконнект "Ангара" — по задержке на пересылку MPI сообщения сопоставима с Infiniband, 0,85 мкс против [0,9 мкс у Infiniband] (http://sc16.supercomputing.org/sc-archive/tech_poster/poster_files/post149s2-file3.pdf).

который практически полностью теперь тоже принадлежит nvidia (после покупки mellanox).
Я правильно понимаю, что этот суперкомпьютер надо скорее рассматривать как proof of principle для нового поколения коммутации «Ангара»? Вот сомневаюсь я, что «Фишер» стоит как 32 видюшки.

До некоторой степени, да. "Ангара" работает, но любят всё российское у нас только на словах, а на деле НИЦЕВТу не особо верят и на предложения собрать на их интерконнекте хотя бы тестовый кластер отвечают "мы перезвоним". Ну вот в ОИВТ всё-таки собрали.
По стоимости — 32 видюшки без блоков питания, матплат, оперативной памяти, процессоров, дисковой и сетевой периферии тоже как бы не нужны, а со всем этим они и стоить сразу начинают ого-го.

Я конечно не специалистка, но всегда считала, что суперкомпьютер отличается от кластера в частности тем, что между узлами используется не сетевой интерфейс, а высокоскоростные шины.

В статье везде путаница с терминологией. Там то про сетевой интерфейс, то про вычислительный узел (который почему-то назван суперкомпьютером). Короче, что это было на самом деле так и не поняла.
Я конечно не специалистка, но всегда считала, что суперкомпьютер отличается от кластера в частности тем, что между узлами используется не сетевой интерфейс, а высокоскоростные шины.

В суперкомпьютерах обычно используется Infiniband. Считать его сетевым интерфейсом или нет — вопрос религии. Другое дело что там используется его RDMA функционал.

Принципиальная разница между MPI-интерконнектами, если очень грубо это либо соединения между процессорами (ccNuma), либо на уровне шины PCI-Express (Infiniband, Ангара и т.п.).
В первом случае очень дорого, но получаем некое подобие SMP (aka NUMA).
Во втором случае всё действительно очень похоже на соединение сетевыми картами, только интерфейсы и протоколы более скоростные с меньшими задерками, но и длина зачастую существенно меньше. Ну и это кластер, а не SMP/NUMA.

В статье с кричащим названием какая то непонятная мешанина фактов. Одному мне здесь многое непонятно?

Не только вам. От таких заголовков уши вянут, вместо реальной работы. Пусть спокойно запустят, даст профит, но без кликбейта.

НЛО прилетело и опубликовало эту надпись здесь
Советские инженеры перестали быть советскими 18 лет назад.
А какое именно событие, произошедшее именно 18 лет назад, сделало уже не существующих к тому времени советских инженеров не советскими?
28 лет назад.
Да, прошу прощения. 28 лет.
Энергопотребление до 20 Вт

Маловато будет. Может, всё-таки киловатты?
Это потребление этой карты, которая толи сетевая, толи еще какой-то интерконнект.
Разработали карту, на базе которой можно построить (и вроде построили суперкомп)
Статья конечно дичь, от заголовка до содержания

Я немного не понял. Эта карта что-то вычисляет? Столько террафлопс на 20Вт? На 65нм тех процессе? Да это почти перпетуум мобиле! Или же этот кусок устаревшего г… на просто позволяет отправить пачку данных в супер компьютер на сверхвысокоростную обработку на такой огромной скорости? Как я понял это именно об этом и идёт речь. При чём здесь 2080? Ну создали сверх быстрый интерфейс. Ну молодцы. Но не он эти операции обсчитывает. Это блин как рекламировать модем. Который быстрее звуковой карты, поскольку может музыку скачать за 2 секунды, а звуковая карта такой сигнал вообще не воспроизведет. Нелогично? Как и эта статья.

Это карта которую можно использовать для построения кластеров. Дальше можно ставить куда хочется.
В России разработана самая передовая технология, написания непонятных статей о передовых технологиях.

Интересно, если нельзя притянуть за уши какую-нибудь компанию покрупнее, то статья и не будет написана. Это так работает?

Что-то это начинает очень походить на akket.com. Даже обидно как-то за хабр.

Уже давно и смартфоны разработали, показывали, и внедряли планшеты в школы, и даже глонасс сделали, правда, ненадолго, и ракеты в мультфильмах.

На самом деле, очень своевременное решение (если действительно это решение работает, как заявлено). Основным поставщиком Infiniband оборудования является израильский Mellanox, который теперь является частью nvidia (плюс немного Qlogic, который тоже американский). Если сервера в режиме санкций можно закупить где-угодно, в том же Китае, то вот с Infiniband теперь могут быть проблемы.

Однако, в настоящий момент на сайте Ангары нашел только PCIe-карты, коммутаторов не видать…

Есть публикации с тестами: раз, два.
Во второй есть и статистика использования кластера, чтобы тут не думали, будто это оборудование годится только на то, чтобы тесты на нём прогнать и оставить пылиться.

Прочитал, спасибо. Нет там коммутаторов. Узлы соединяются друг с другом, образуя кольцевую (тороидальную) шину. Коммутаторы Infiniband «могут быть организованы в сети с топологиями типа утолщенное дерево (Fat Tree), Сеть Клоза, реже — многомерный тор, двойная звезда, и в различных гибридных комбинациях», т.е.вариантов больше. Я также вижу слабое место — гигабитная сеть в параллели с ангарой. Infiniband в себя также инкапсулирует IP и не требует отдельной сетевой карты, отбирающей ресурсы PCIe шины, необходимой для CUDA и интерконнекта.
Тем не менее, будем посмотреть, во что это все вырастет.

Да, тесты все для PCIe исполнения. Что в новой системе коммутаторная версия — я только из этой новости и узнал.
Тор — это неплохо, по крайней мере, для HPC. IBM Blue Gene с тороидальной топологией сети какое-то время стабильно занимали первые места в Top500. Сейчас, правда, сами IBM ушли в сторону Fat Tree — как объясняют, на большой системе проводов меньше.
С точки зрения MPI, тор даёт быстрее точечные обмены (send/receive) между соседними узлами, а fat tree — глобальные операции (broadcast, scatter/gather, reduce, alltoall).

Он хоть дешевле чем 32 видеокарты + матплаты с процами к ним?
То есть экономически оно выгодно?

Не думаю, что цена здесь является основным параметром, но позволю себе немного развить эту тему. Во имя пятницы.
Он хоть дешевле чем 32 видеокарты + матплаты с процами к ним?
Вы забыли про систему охлаждения и про энергоснабжение, соответствующее охлаждению. Но это мелочи, наверняка цена станет основным козырем, терафлопсы есть терафлопсы, не так ли?
В оригинальном пресс-релизе:
В ОИВТ РАН уже несколько лет используется суперкомпьютер DESMOS мощностью 52,24 Тфлопс, созданный на базе предыдущего поколения сети «Ангара». Его вычислительные мощности оказались настолько востребованы учеными, что было принято решение о создании «младшего брата» этого суперкомпьютера уже на базе нового поколения коммутационной сети. Его производительность рассчитана под конкретные задачи, но при необходимости возможности «Фишера» могут быть существенно расширены
Самое трудное — конкретность каких-то задач и возможность расширения. Но всё решаемо, конечно.
До основания стартапа по закупке видеокарт осталось несколько шагов:
— Уточнить решаемые задачи.
— Прикинуть решение «на видеокартах».
— Получить сертификаты по допускам и надежности.
— С легкостью выиграть конкурс по цене.
— Начать массовые продажи решения в другие институты и учреждения, в которых заседают замшелые старики, которые до сих пор думают, что видеокарты годятся лишь для игр и майнинга.
— Написать книгу о свершившейся революции.

А что он дороже-то будет? Плюс-минус одинаково стоит, и доля утилизируемой производительности от пиковой выше, чем с видеокартами.
Память, дисковое хранилище, интерконнект, система охлаждения, ИБП — нужны в равной мере CPU и GPU системам. Или видеокарты должны магическим образом без этого всего образовать параллельную вычислительную систему?

по-моему ПО для облачных вычислений хорошо развито в настоящее время.

Сравнить видюху с компом… Это только русские так могут!

А бюджету эта "разработка" обошлась как строительство завода Nvidia? Покажут путену матплату Huanan с русскими наклейками и он ещё трилиончик на реализацию. Ничего нового.

Я немного не понял насчёт минусов… Если хабр прополитизировался, то может кто подскажет альтернативы?
Никто так и не написал как связанны сетевая карта которая сама ничего не считает и видеокарта, которая сама считает. Какие террафлопсы? Зачем сравнивать пору с пальцем?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости