Как стать автором

GPGPU *

Технология Nvidia для реализации алгоритмов

Статьи Посты Новости Авторы Компании

MomoDev 9 окт 2019 в 11:42

Уравнение Навье-Стокса и симуляция жидкостей на CUDA

24 мин

52K

C++*GPGPU*Математика*Физика

Из песочницы

Привет, Хабр. В этой статье мы разберемся с уравнением Навье-Стокса для несжимаемой жидкости, численно его решим и сделаем красивую симуляцию, работающую за счет параллельного вычисления на CUDA. Основная цель — показать, как можно применить математику, лежащую в основе уравнения, на практике при решении задачи моделирования жидкостей и газов.

Читать дальше →

+46

UrsusDominatus 26 сен 2019 в 17:06

GPU Bound. Как перенести на видеокарту все и немножко больше. Анимации

11 мин

9.9K

Работа с 3D-графикой*Разработка игр*GPGPU*Unity*

Когда-то давно, было огромным событием появления на GPU блока мультитекстурирования или hardware transformation & lighting (T&L). Настройка Fixed Function Pipeline была магическим шаманством. А те кто умел включать и использовать расширенные возможности конкретных чипов через D3D9 API hacks, считали себя познавшими дзен. Но время шло, появились шейдеры. Сначала, сильно лимитированные как по функционалу, так и по длине. Далее все больше возможностей, больше инструкций, больше скорость выполнения. Появился compute (CUDA, OpenCL, DirectCompute), и область применения мощностей видеокарт стала стремительно расширяться.

В этом цикле (надеюсь) статей я постараюсь расказать и показать, как «необычно» можно применить возможности современного GPU, при разработке игр, помимо графических эффектов. Первая часть будет посвящена анимационной системе. Все что описано, основано на практическом опыте, реализовано и работает в реальных игровых проектах.

Читать дальше →

+15

pavel_kudinov 24 сен 2019 в 13:22

Космики. 7 лет

5 мин

16K

JavaScript*Разработка игр*GPGPU*Машинное обучение*Научно-популярное

Здравствуй, Хабр!

В 2012 году я написал пост о своем увлечении — Космики: моделирование эволюции многоклеточных организмов

С того момента прошло без малого 7 лет, в течение которых я работал над развитием этого проекта. Сегодня я хочу рассказать немного о том, что научился делать, и как планирую развивать проект дальше.

Читать дальше →

+107

exec77 4 сен 2019 в 11:57

Прикладные технологии на руинах блокчейн-лихорадки или о практической пользе распределения ресурсов

6 мин

3.1K

Децентрализованные сети*Работа с 3D-графикой*GPGPU*Облачные вычисления*CGI (графика)*

Из песочницы

В последние годы новостные ленты наводнили сообщения о появляющихся буквально из ниоткуда распределенных вычислительных сетях нового типа, решающих (точнее, пытающихся решить) самые разнообразные задачи — сделать город умным, спасти мир от нарушителей авторских прав или наоборот, тайно передать информацию или ресурсы, сбежать из-под контроля государства в той или иной сфере. Вне зависимости от сферы, все они обладают рядом общих черт, обусловленных тем, что топливом для их роста явились алгоритмы и методики, вышедшие в широкие массы во время недавнего бума криптовалют и связанных с ними технологий. Наверное, каждая третья статья на профильных ресурсах в то время в названии имела слово “блокчейн” — обсуждение новых программных решений и экономических моделей некоторое время стало доминирующим трендом, на фоне которого иные сферы применения систем распределенных вычислений были отодвинуты на второй план.

В то же время визионеры и профессионалы увидели основную суть явления: массовые распределенные вычисления, связанные с построением сетей из большого числа разрозненных и разнородных участников, вышли на новый уровень развития. Достаточно выбросить из головы хайповые темы и взглянуть на предмет с другой стороны: все эти сети, собранные из огромных пулов, в которых состоят тысячи обособленных разнородных участников, появились не сами по себе. Энтузиасты крипто-движения смогли разрешить в новом ключе сложные проблемы синхронизации данных и распределения ресурсов и задач, что и позволило собрать воедино подобную массу оборудования и создать новую экосистему, предназначенную для решения одной узконаправленной задачи.

Читать дальше →

+9

matkov 17 авг 2019 в 12:31

Установка OpenCV + CUDA на Windows

7 мин

37K

Python*C++*GPGPU*Обработка изображений*Машинное обучение*

Из песочницы

Введение

В данной статье речь пойдет о сборке и установке OpenCV 4 для C/C++, Python 2 и Python 3 из исходных файлов с дополнительными модулями CUDA 10 на ОС Windows.

Я постарался включить сюда все тонкости и нюансы, с которыми можно столкнуться в ходе установки, и про которые не написано в официальном мануале.

Читать дальше →

+10

KarevAnton 27 мая 2019 в 07:46

Аппаратные компоненты бортовой МПС унифицированного ударного истребителя F-35

10 мин

9.6K

Высокая производительность*GPGPU*Big Data*Визуализация данных*FPGA*

Приоритеты современной военной авиации сосредоточены на качественной ситуационной осведомлённости, поэтому современный истребитель представляет собой летающий рой высокотехнологичных сенсоров. Сбор информации с этих сенсоров, её обработку и представление пользователю осуществляет бортовая микропроцессорная система (МПС). Вчера для её реализации использовались HPEC-гибриды (включающие в себя CPU, GPU и FPGA). Сегодня для её реализации используются однокристальные SoC-системы, которые помимо того, что все компоненты на один чипсет собирают, так ещё и внутричиповую сеть организуют (NoC), как альтернативу традиционной магистрали передачи данных. Завтра, когда SoC-системы станут ещё более зрелыми, ожидается приход полиморфной наноэлектроники, которая даст существенный прирост производительности и снизит темп своего морального устаревания.

Читать дальше →

+11

AndrewSu 18 мар 2019 в 22:25

Задача N тел или как взорвать галактику не выходя из кухни

34 мин

46K

Алгоритмы*GPGPU*Математика*Параллельное программирование*Физика

Не так давно я прочёл фантастический роман «Задача трёх тел» Лю Цысиня. В нём у одних инопланетян была проблема — они не умели, с достаточной для них точностью, вычислять траекторию своей родной планеты. В отличии от нас, они жили в системе из трёх звёзд, и от их взаимного расположения сильно зависела «погода» на планете — от испепеляющей жары до леденящего мороза. И я решил проверить, можем ли мы решать подобные задачи.

Читать дальше →

+177

Normal_Mur 14 окт 2018 в 18:08

Функция Math.Sin (double) для GPU

11 мин

6.8K

GPGPU*C#*Математика*Unity*

Из песочницы

Предисловие

Мне понадобилось вычислять дугу с повышенной точностью на процессоре видеокарты в режиме реального времени.

Автор не ставил перед собой цель превзойти стандартную функцию System.Math.Sin() (C#) и ее не достиг.

Читать дальше →

+9

fyodorser 27 сен 2018 в 09:57

Быстрый ресайз джипегов на видеокарте

9 мин

9K

GPGPU*Облачные вычисления*Обработка изображений*Параллельное программирование*Софт

В приложениях по работе с изображениями довольно часто встречается задача ресайза джипегов (картинок, сжатых по алгоритму JPEG). В этом случае сразу сделать ресайз нельзя и нужно сначала декодировать исходные данные. Ничего сложного и нового в этом нет, но если это нужно делать много миллионов раз в сутки, то особую важность приобретает оптимизация производительности такого решения, которое должно быть очень быстрым.

Читать дальше →

+23

nzavyalov 23 июл 2018 в 09:51

Графические процессоры в решении современных IT-задач

10 мин

17K

Блог компании SelectelIT-инфраструктура*GPGPU*История ITНаучно-популярное

Графические процессоры (graphics processing unit, GPU) — яркий пример того, как технология, спроектированная для задач графической обработки, распространилась на несвязанную область высокопроизводительных вычислений. Современные GPU являются сердцем множества сложнейших проектов в сфере машинного обучения и анализа данных. В нашей обзорной статье мы расскажем, как клиенты Selectel используют оборудование с GPU, и подумаем о будущем науки о данных и вычислительных устройств вместе с преподавателями Школы анализа данных Яндекс.

Читать дальше →

+14

Magn 4 июл 2018 в 11:03

CUDA и удалённый GPU

7 мин

20K

Высокая производительность*GPGPU*Параллельное программирование*

Из песочницы

CUDA всем хороша, пока под рукой есть видеокарта от Nvidia. Но что делать, когда на любимом ноутбуке нет Nvidia видеокарты? Или нужно вести разработку в виртуальной машине?

Я постараюсь рассмотреть в этой статье такое решение, как фреймворк rCUDA (Remote CUDA), который поможет, когда Nvidia видеокарта есть, но установлена не в той машине, на которой предполагается запуск CUDA приложений. Тем, кому это интересно, добро пожаловать под кат.

TLDR

rCUDA (Remote CUDA) — фреймворк, реализующий CUDA API, позволяющий использовать удалённую видеокарту. Находится в работоспособной бета-версии, доступен только под Linux. Основная цель rCUDA — полная совместимость с CUDA API, вам не нужно никак модифицировать свой код, достаточно задать специальные переменные среды.

Читать дальше →

+17

m1rko 29 апр 2018 в 17:10

Сравнение Google TPUv2 и Nvidia V100 на ResNet-50

7 мин

16K

Высокая производительность*GPGPU*Облачные вычисления*Машинное обучение*Google Cloud Platform*

Перевод

Недавно Google добавила к списку облачных услуг Tensor Processing Unit v2 (TPUv2) — процессор, специально разработанный для ускорения глубокого обучения. Это второе поколение первого в мире общедоступного ускорителя глубокого обучения, который претендует на альтернативу графическим процессорам Nvidia. Недавно мы рассказывали о первых впечатлениях. Многие просили провести более детальное сравнение с графическими процессорами Nvidia V100.

Объективно и осмысленно сравнить ускорители глубокого обучения — нетривиальная задача. Но из-за будущей важности этой категории продуктов и отсутствия подробных сравнений мы чувствовали необходимость провести самостоятельные тесты. Сюда входит и учёт мнений потенциально противоположных сторон. Вот почему мы связались с инженерами Google и Nvidia — и предложили им прокомментировать черновик этой статьи. Чтобы гарантировать отсутствие предвзятости, мы пригласили также независимых экспертов. Благодаря этому получилось, насколько нам известно, самое полное на сегодняшний день сравнение TPUv2 и V100.

Читать дальше →

+31

1cloud 27 апр 2018 в 15:01

Новая «работа» для графических процессоров: GPU защитит от вирусных атак

3 мин

6.3K

Блог компании 1cloud.ruВысокая производительность*Информационная безопасность*Системное администрирование*GPGPU*

В прошлом месяце компания Intel объявила, что собирается перепроектировать свои процессоры на кремниевом уровне, чтобы исключить уязвимости Spectre и Meltdown.

Однако на этом работа компании по увеличению защищенности систем не закончилась. Недавно стало известно, что ИТ-гигант собирается внедрить технологии, которые будут бороться с вирусными угрозами на аппаратном уровне.

Речь идет о системах Accelerated Memory Scanning и Advanced Platform Telemetry. Подробнее о нововведениях расскажем далее.

Читать дальше →

+13

m1rko 27 фев 2018 в 11:01

Бенчмарк нового тензорного процессора Google для глубинного обучения

5 мин

17K

GPGPU*Облачные вычисления*Машинное обучение*Google Cloud Platform*

Перевод

Каждое устройство Cloud TPU состоит из четырёх «чипов TPUv2». В чипе 16 ГБ памяти и два ядра, каждое ядро с двумя юнитами для умножения матриц. Вместе два ядра выдают 45 TFLOPS, в общей сложности 180 TFLOPS и 64 ГБ памяти на один TPU

Большинство из нас осуществляет глубинное обучение на Nvidia GPU. В настоящее время практически нет альтернатив. Тензорный процессор Google (Tensor Processing Unit, TPU) — специально разработанный чип для глубинного обучения, который должен изменить ситуацию.

Через девять месяцев после первоначального анонса две недели назад Google наконец-то выпустила TPUv2 и открыла доступ первым бета-тестерам на платформе Google Cloud. Мы в компании RiseML воспользовались возможностью и прогнали парочку быстрых бенчмарков. Хотим поделиться своим опытом и предварительными результатами.

Давно мы ждали появления конкуренция на рынке оборудования для глубинного обучения. Она должна разрушить монополию Nvidia и определить, как будет выглядеть будущая инфраструктура глубинного обучения.

Читать дальше →

+31

Dumbris 1 фев 2018 в 18:21

Бесплатная GPU Tesla K80 для ваших экспериментов с нейросетями

6 мин

72K

*nix*GPGPU*Машинное обучение*Google Cloud Platform*

Около месяца назад Google сервис Colaboratory, предоставляющий доступ к Jupyter ноутбукам, включил возможность бесплатно использовать GPU Tesla K80 с 13 Гб видеопамяти на борту. Если до сих пор единственным препятствием для погружения в мир нейросетей могло быть отсутствие доступа к GPU, теперь Вы можете смело сказать, “Держись Deep Learning, я иду!”.

Я попробовал использовать Colaboratory для работы над kaggle задачами. Мне больше всего не хватало возможности удобно сохранять натренированные tensorflow модели и использовать tensorboard. В данном посте, я хочу поделиться опытом и рассказать, как эти возможности добавить в colab. А напоследок покажу, как можно получить доступ к контейнеру по ssh и пользоваться привычными удобными инструментами bash, screen, rsync.

Читать дальше →

+40

it_man 17 янв 2018 в 15:30

ЦОД без GeForce и Titan: в NVIDIA изменили лицензионное соглашение

3 мин

42K

Блог компании CloudMTSВысокая производительность*Системное администрирование*IT-инфраструктура*GPGPU*

Компания NVIDIA изменила лицензионное соглашение для драйвера, и теперь использовать графические процессоры GeForce и Titan в дата-центрах запрещено. Почему так получилось, кого коснутся изменения и какие есть альтернативы, читайте под катом.

Читать дальше →

+49

Magistr 11 янв 2018 в 02:46

Что ещё необходимо узнать про OpenCL C перед тем, как на нём писать

13 мин

16K

Высокая производительность*GPGPU*Параллельное программирование*

Как было написано	`float4 val = (0, 0, 0, 0);`
Что хотел написать автор	`float4 val = (float4)(0, 0, 0, 0);`
Как нужно было написать	`float4 val = 0;`

Если Вы сталкивались с OpenCL или планируете столкнуться и не видите разницы между первым и вторым вариантом, а третий вызывает у Вас сомнения — «А скомпилируется ли вообще?» — добро пожаловать под кат, там много нюансов языка и совсем ничего про API и оптимизацию производительности.

Читать дальше →

+43

ThisIsZolden 8 янв 2018 в 21:26

Физическое моделирование на GPU с использованием compute shader в среде Unity3D

17 мин

37K

Программирование*GPGPU*C#*Параллельное программирование*Unity*

Туториал

В этом руководстве я расскажу, как использовать compute shader для реализации вычислений на видеокарте — на примере модели волос:

+51

ThisIsZolden 8 янв 2018 в 19:45

Вычисления на видеокарте, руководство, лёгкий уровень

3 мин

35K

Программирование*GPGPU*C#*Параллельное программирование*Unity*

Туториал

Это руководство поясняет работу простейшей программы, производящей вычисления на GPU. Вот ссылка на проект Юнити этой программы:

ссылка на файл проекта .unitypackage

Она рисует фрактал Мандельброта.

Я не буду пояснять каждую строчку кода, укажу только необходимые действия для реализации вычислений на GPU. Поэтому, лучше всего открыть код программы в Юнити и там смотреть, как используются поясняемые мной строчки кода.

Шейдер, который рисует фрактал, написан на языке HLSL. Ниже приведён его текст. Я кратко прокомментировал значимые строки, а развёрнутые объяснения будут ниже.

Читать дальше →

+30

ThisIsZolden 19 дек 2017 в 19:10

Доделал игру, работающую на видеокарте

3 мин

87K

Разработка игр*GPGPU*Параллельное программирование*Unity*Дизайн игр*

Наконец-то я доделал игру, которая работает на видеокарте. Она несколько месяцев повисела в раннем доступе на стиме, и теперь я её окончательно выпустил. Основная фишка игры в том, что она представляет собой физическую симуляцию, которая выполняется на графическом процессоре. Основной код игры — это огромный compute shader, 6 тысяч строк на HLSL. Десятки тысяч взаимодействующих частиц обрабатываются параллельно, и выходит довольно быстро. Всё в игре сделано из этих частиц. Вот несколько гифок о том, как это работает:

Читать дальше →

+265

3