Комментарии / Профиль izakharkin / Хабр

На тот момент меня впечатлила прежде всего возможность решать с помощью одной модели (CenterNet) сразу трех задач: детекция в 2D, в 3D и оценка позы, плюс они в статье репортят SOTA-скорость у CenterNet-DLA (в таблице 2) при AP выше, чем у YOLOv3, что в моих глазах выглядело как SOTA в speed/accuracy trade-off (что, на мой взгляд, для детекторов важнее, чем только speed или только AP).

Сам я измерение скорости и качества всех приведенных в этом посте моделей не проводил, потому и написал «Кажется», и "(но это не точно)", однако хотел все же обратить внимание на CenterNet.

p.s. Поздравляю с YOLOv4! Выглядит очень многообещающе, однозначно добавлю в этот пост Вашу статью.

Посмотреть

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 2)

izakharkin 5 ноя 2019 в 23:22

Здравствуйте!
Рад, что статья оказалась полезной)
Кажется, что тот же github.com/argman/EAST уже обучен под детектирование в том числе и цифр. Если Вам нужно только цифры, и чтобы текст не детектировался, то наверное проще всего просто на этапе пост-обработки детекций выбрасывать боксы только с текстом, или же да, обучить архитектуру с нуля только под цифры. Код из вышеприведенного репозитория позволяет это сделать.

Посмотреть

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 2)

izakharkin 10 июл 2019 в 19:37

Да, это правда, спасибо :)
Картинку взял на самом деле для демонстрации того, как выглядят боксы (слева). Про сегментацию будет отдельный разговор в третьей части.

Посмотреть

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 1)

izakharkin 23 мая 2019 в 12:40

Спасибо! Рад, что статья оказалась полезной
Постараюсь сделать вторую часть достаточно подробной

Посмотреть

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 1)

izakharkin 21 мая 2019 в 18:03

Спасибо!
Если речь идёт о видеокартах, то мы используем Nvidia GeForce GTX 1080 Ti. Если интересует более подробно, могу поделиться в личных сообщениях

Посмотреть

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 1)

izakharkin 21 мая 2019 в 16:01

В статье использованы изображения из открытых источников, все ссылки на них указаны здесь: bit.ly/2YIVokO

Посмотреть

Generative adversarial networks

izakharkin 11 апр 2018 в 20:44

Визуализация особенно доставила)
Спасибо за статью!

Посмотреть

Скрытые Марковские модели в распознавании речи

izakharkin 29 сен 2017 в 20:15

В самой первой формуле опечатка — произведение не по t, а по i.

Посмотреть

История 3-го места на ML Boot Camp III

izakharkin 22 мар 2017 в 22:14

А жаль

Посмотреть

История 3-го места на ML Boot Camp III

izakharkin 22 мар 2017 в 17:38

Большое спасибо за статью.
Особенно понравилась идея с ансамблем (получение «доверительных вероятностей»), успехов Вам в будущих соревнованиях!

Посмотреть

Как различать британскую и американскую литературу с помощью машинного обучения

izakharkin 27 фев 2017 в 00:36

Очень интересное исследование!
Спасибо за статью

Посмотреть

Практика метапрограммирования на C++: бинарное дерево поиска на этапе компиляции

izakharkin 29 янв 2017 в 15:02

Большое спасибо за статью!
Очень грамотно и интересно написано, буду ждать продолжения

-1

Посмотреть

Тематическое моделирование репозиториев на GitHub

izakharkin 3 янв 2017 в 02:13

Крутая статья и интересное исследование, спасибо :)

Посмотреть

«Во все тяжкие» или суровые реальности инди разработки Dark Forester

izakharkin 2 янв 2017 в 15:17

Топ стори, буду ждать продолжения!

Посмотреть

Диаграмма Вороного и её применения

izakharkin 7 сен 2016 в 19:33

Согласен, в 3D всё будет уже не так интуитивно понятно и просто. В будущем, возможно, я напишу статью и на эту тему (однако сначала реализация алгоритма Форчуна).

Посмотреть

Диаграмма Вороного и её применения

izakharkin 5 сен 2016 в 20:33

Вы правы, у жирафов рисунок не всегда в точности является диаграммой, тем более, что у всех жирафов он разный.
Однако в тексте отмечено, что он фактически является диаграммой, поскольку сходство очевидно, и наличие нескольких линий, делающих многоугольники рисунка невыпуклыми, этого факта не отменяют.

-1

Посмотреть