26 January 2016

Microsoft выложила на Github инструментарий CNTK для глубинного обучения

Open sourceGPGPUImage processingMachine learning


Microsoft выложила в открытый доступ исходный код инструментов, которые используются в компании для ускорения разработок в области искусственного интеллекта: набор Computational Network Toolkit опубликован на Github.

Как сообщается в официальном блоге, исследователям пришлось создать набор инструментов CNTK из необходимости. Ведущий специалист Microsoft по системам распознавания речи Сюэдун Хуан (Xuedong Huang) говорит, что разработчики в его группе были озабочены проблемой, как ускорить процесс распознавания речи компьютерами, а имеющиеся инструменты работали слишком медленно.

Поэтому группа добровольцев вызвалась решить проблему самостоятельно, используя собственное решение, которое ставило производительность на первое место.

Усилия окупились сполна.

Во внутренних тестах CNTK показал более высокую производительность, чем четыре других популярных вычислительных инструментария, которые разработчики используют для создания моделей глубинного обучения в задачах вроде распознавания речи и распознавания образов, за счёт лучших коммуникационных возможностей.

«Инструментарий CNTK просто невероятно более эффективен, чем всё, что нам доводилось видеть», — признаёт Сюэдун Хуан.

Прирост производительности такого рода исключительно важен для стремительно развивающейся области глубинного обучения, потому что некоторые из самых сложных задач глубинного обучения могут вычисляться неделями.



За последние несколько лет область глубинного обучения сделала большой шаг вперёд, поскольку всё больше исследователей запускают алгоритмы машинного обучения с использованием глубоких нейросетей. Многие считают, что глубинное обучение имеет потенциал для улучшений в области искусственного интеллекта, пишет Microsoft.

Достигнутый прогресс позволил создавать системы, которые точно распознают и даже переводят речь, а также системы распознавания изображений, способные даже отвечать на вопросы о них.

В компании Microsoft инструментарий CNTK используется на кластере мощных компьютеров с GPU. Оказалось, что GPU идеально подходят для обработки таких алгоритмов, благодаря им произошёл такой рывок в технологиях синтеза, распознавания и понимания речи, распознавания изображений и движения на видео.

Пользу от инструментов CNTK может извлечь каждый: от разработчика с ограниченным бюджетом и единственным компьютером до компании, способной поднять целый кластер серверов с GPU. Разработчики Microsoft утверждают, что CNTK масштабируется для параллельной работы на многих GPU-машинах гораздо лучше, чем другие публично доступные инструменты такого рода.

В апреле прошлого года Microsoft открыла CNTK для академических исследователей через Codeplex под более ограниченной свободной лицензией. Начиная с понедельника CNTK доступен абсолютно для всех.

Независимые разработчики выражают удовольствие такими положительными действиями Microsoft, но при этом не упускают возможности подколоть компанию: «Только Microsoft могла открыть документацию на гитхабе в формате docx», — пишет один из них.
Tags:глубинное обучениераспознавание речикомпьютерное зрениенейросетиCNTK
Hubs: Open source GPGPU Image processing Machine learning
+22
16k 132
Comments 8
Popular right now
Специалист по машинному обучению (Machine Learning)
from 20,000 to 60,000 ₽БастионМоскваRemote job
Senior ML Engineer
from 4,000 to 5,500 $HyprrRemote job
C/C++ Developer, Digital image processing
from 2,000 to 2,500 $Almalence, Inc.Новосибирск
Middle/Senior Software Engineer
from 100,000 ₽dicehub GmbH - GermanyRemote job
Data Scientist
from 150,000 to 300,000 ₽NZT GroupМосква