Sangeliuk Jun 16 2020 at 12:31

ABBYY NeoML: как мы делали библиотеку машинного обучения и зачем она нужна

10 min

13K

Content AI corporate blogMicrosoft corporate blogOpen source*Programming*Machine learning*

+49

Comments 18

UFO just landed and posted this here

Sangeliuk Jun 16 2020 at 15:30

Спасибо!
ICM не пробовали, пробовали Vulkan. Наш движок для Vulkan можно с незначительными изменениями запустить на Intel Graphics. На сколько я помню, скорость инференса была сопоставима с одним потоком CPU. Возможно, в будущем мы официально поддержим Intel Graphics.

AlexSerbul Jun 16 2020 at 16:01

Молодцы коллеги! Так держать. Очень крутую и полезную работу делаете. В ближайшее время мы обязательно попробуем вашу библиотеку в наших ML-проектах на Битрикс24.

XaocCPS Jun 16 2020 at 16:26

Саша, спасибо! Ждем отзывов, всегда на связи.

slonoten Jun 16 2020 at 17:09

Первый DL framework от российской компании? С почином!
Осталось еще свой TPU запилить и "здравствуй, нейроимпортозамещение".

Displacer Jun 16 2020 at 18:45

У нас в России есть: нейропроцессор НТЦ «Модуль» Для него возможно сделать backend?

Sangeliuk Jun 16 2020 at 19:51

Да, конечно.

MooNDeaR Jun 16 2020 at 23:39

Я понимаю, что задам немного тупой вопрос, но что делают *.bld файлы?) Какая-то система сборки?

Sangeliuk Jun 17 2020 at 00:33

Да, это внутрикорпоративная система сборки.

MooNDeaR Jun 17 2020 at 08:54

Немного странно их видеть в open-source :)
Вы там комментарий какой-нибудь оставьте штоль :)

canxes Jun 17 2020 at 00:34

Отличная работа! Но будущее, имхо, за 'компиляцией' графа вычислений при релизе(a-ля tvm). Это позволяет за счет кодогенерации проводить оптимизации совершенно другого уровня. В ход идут не только классические трюки компиляторов(dead code elimination, constant-folding, operations fusion и т.д.), но и более экзотические идеи о автоматическом подборе структуры циклов в слоях под конкретное железо.

dustalov Jun 17 2020 at 12:37

Поздравляю с релизом!

Из статьи мне показалось, что вам важнее удобно и эффективно запускать модели, обученные при помощи других библиотек, таких как PyTorch и TensorFlow, чем использовать собственный код для обучения. Уверены ли вы в целесообразности разработки и поддержки ещё одной полнофункциональной библиотеки для машинного обучения, если можно сосредоточиться на развёртывании моделей? На мой взгляд, довольно тяжело соревноваться с ресурсами и сообществом вокруг проектов Facebook и Google.

Sangeliuk Jun 17 2020 at 14:55

Спасибо!
Не совсем так, у нас работа с TF и PyTorch ведется главным образом на стадии экспериментов, финальное обучение делается на NeoML. К тому же, есть еще дообучение у клиента. Так что, обучение нам нужно!
Мы не соревнуемся, мы решаем свои задачи и делимся результатом)

lord_nn Jun 18 2020 at 16:43

Поздравляю с выпуском!
Не сравнивались с ArmNN/ArmCL на мобильных CPU/GPU?

Sangeliuk Jun 18 2020 at 16:45

Спасибо!
Замеров на сетях мы не делали, мы сравнивали BLAS c ArmCL на Android-CPU, работали одинаково.

lord_nn Jun 19 2020 at 00:35

BLAS это важно, но в сетях в чистом виде это где? в полносвязном слое разве. А вот сравнить свёртки, которых часто много и которые иногда включают в себя BLAS (через Winograd Fast Convolution например). Было бы интересно про GPU также узнать, это мой bias, так сказать. На Adreno можно с SNPE посравниваться.
Можно попросить какой-нибудь контакт (ваш или другого добровольца), помочь разобраться, самому промерять?

Sangeliuk Jun 19 2020 at 14:26

Умножение матриц это основной элемент, например, в MobileNetV2.
Да, конечно, вот мой: stanislav.angelyuk@abbyy.com.
Мы сейчас планируем выделить ресурсы для оптимизации Vulkan, можно будет сделать что-нибудь вместе, с оптимизацией под ваши задачи.

DimaTheGreat Jun 19 2020 at 14:26

Great job! Приятно узнать об отечественном проекте такого уровня.
Вот такой вопрос: можно ли быстро на коленках сделать что-нибудь подобное на данный момент или нет julialang.org/blog/2019/01/fluxdiffeq?
Интересует моделирование систем ОДУ.